从HTML字符串中获取纯文本字符串的最佳方法是什么?

public string GetPlainText(string htmlString)
{
    // any .NET built in utility?
}

提前致谢

最佳答案

据我所知,没有内置的实用程序,但是根据您的要求,您可以使用正则表达式删除所有标签:

string htmlString = @"<p>I'm HTML!</p>";
Regex.Replace(htmlString, @"<(.|\n)*?>", "");

10-02 20:42