需要一些有关HTML Agility Pack的帮助!

基本上,我想在HTML的body节点中抓取纯文本
到目前为止,我已经在vb.net中尝试了此操作,但它未能返回innertext的含义
没有看到任何变化,至少与我看到的一样。

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

我已经试过了:
Return htmldoc.DocumentNode.InnerText

但是仍然没有运气!

有什么建议吗?

最佳答案

怎么样:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText

关于c# - 使用HTML Agility Pack从HTML BODY节点提取内部文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6852165/

10-10 01:25