在我的程序中,我使用了字符串变量内容。我已经为这个字符串分配了一个小的HTML程序。例如,

String content = "<HTML> <HEAD> <TITLE>Your Title Here</TITLE></HEAD> <BODY><H2>This is a Medium Header Send me mail at<a href="mailto:[email protected]">[email protected]</a>.This is a new sentence without a paragraph break.</H2></BODY></HTML>";

从这个我想得到“这是一个中等的头”
请发邮件至[email protected]。这是一个没有段落分隔的新句子。
此字符串在标记中可用。如何使用c#获取此字符串。

最佳答案

不要使用字符串方法或正则表达式来解析HTML。您可以使用HtmlAgilityPack

string content = "<HTML> <HEAD> <TITLE>Your Title Here</TITLE></HEAD> <BODY><H2>This is a Medium Header Send me mail at<a href=\"mailto:[email protected]\">[email protected]</a>.This is a new sentence without a paragraph break.</H2></BODY></HTML>";

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(content);
string headerText = doc.DocumentNode.Descendants("H2").First().InnerText;

结果:
This is a Medium Header Send me mail [email protected] is a new sentence without a paragraph break.

关于c# - 如何从C#中的html代码获取html代码的一部分?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30121263/

10-09 14:16