如果我有一个字符串,其中包含刚从HTTP Post返回的页面中的html,那么如何将其转换为可让我轻松遍历DOM的内容?
我认为HtmlDocument对象会有意义,但是它没有构造函数。是否有任何类型可以轻松管理HTML DOM?
谢谢,
马特
最佳答案
HtmlDocument是WebBrowser控件已加载的文档的实例。因此没有ctor。
Html Agility Pack 是迄今为止我用于此目的的最佳库
来自Codeplex Wiki的示例
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]"))
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
该示例显示了文件的加载,但是有一些重载可让您加载字符串或流。