我有一个包含html的字符串。在此字符串的内部有一个html标记,我想检索该标记的内部文本。如何在C#中做到这一点?
这是我要检索其内部文本的html标记:
<td width="100%" class="container">
最佳答案
使用Html Agility Pack。
编辑这样的内容(未经测试)
HtmlDocument doc = new HtmlDocument();
string html = /* whatever */;
doc.LoadHtml(html);
foreach(HtmlNode td in doc.DocumentElement.SelectNodes("//td[@class='container']")
{
string text = td.InnerText;
// do whatever with text
}
您也可以直接使用a different XPath selector选择文本。
相关问题:
How to use HTML Agility pack
HTMLAgilityPack parse in the InnerHTML
C#: HtmlAgilityPack extract inner text