我正在尝试使用HtmlAgilityPack从HTML提取文本。我已成功将HtmlAgilityPack添加到我的项目中。但是,我尝试使用以下代码提取正文:
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
// There are various options, set as needed
htmlDoc.OptionFixNestedTags=true;
// filePath is a path to a file containing the html
htmlDoc.Load(filePath);
// Use: htmlDoc.LoadXML(xmlString); to load from a string
// ParseErrors is an ArrayList containing any errors from the Load statement
if (htmlDoc.ParseErrors!=null && htmlDoc.ParseErrors.Count>0)
{
// Handle any parse errors as required
}
else
{
if (htmlDoc.DocumentNode != null)
{
HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");
if (bodyNode != null)
{
// Do something with bodyNode
}
}
}
并且在构建项目时收到以下错误。
错误1类型'System.Xml.XPath.IXPathNavigable'是在未引用的程序集中定义的。您必须添加对程序集'System.Xml.XPath,版本= 2.0.5.0,区域性=中性,PublicKeyToken = 31bf3856ad364e35'的引用。 D:\ test \ test \ MainPage.xaml.cs 58
我应该补充一点,我添加了System.Xml参考,但仍然收到此错误。您能帮我解决这个问题吗?谢谢。
最佳答案
谢谢。我发现必须从Microsoft SDKs父文件夹中的Silverlight 4.0文件夹中添加对System.Xml.XPath的引用。