需要一些有关HTML Agility Pack的帮助!
基本上,我想在HTML的body节点中抓取纯文本。
到目前为止,我已经在vb.net中尝试了此操作,但它未能返回innertext的含义
没有看到任何变化,至少与我看到的一样。
Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)
Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")
If Not htmldoc Is Nothing Then
For Each node In paragraph
node.ParentNode.RemoveChild(node, True)
Next
End If
Return htmldoc.DocumentNode.WriteContentTo
我已经试过了:
Return htmldoc.DocumentNode.InnerText
但是仍然没有运气!
有什么建议吗?
最佳答案
怎么样:
Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText
关于c# - 使用HTML Agility Pack从HTML BODY节点提取内部文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6852165/