从HTML字符串中获取纯文本字符串的最佳方法是什么?
public string GetPlainText(string htmlString)
{
// any .NET built in utility?
}
提前致谢
最佳答案
据我所知,没有内置的实用程序,但是根据您的要求,您可以使用正则表达式删除所有标签:
string htmlString = @"<p>I'm HTML!</p>";
Regex.Replace(htmlString, @"<(.|\n)*?>", "");