我有一些需要处理的文本字符串,并且字符串内部有HTML特殊字符。例如:
10����������������10������������������
我想将这些字符转换为utf-8。
我使用了org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4,但是没有运气。有没有简单的方法来解决这个问题?
最佳答案
Apache commons-lang库具有StringEscapeUtils
类,该类具有unescapeHtml()
实用程序方法。
String utf8Str = StringEscapeUtils.unescapeHtml(htmlStr);
您可能还需要
unescapeXml()