我有一些需要处理的文本字符串,并且字符串内部有HTML特殊字符。例如:

10����������������10������������������


我想将这些字符转换为utf-8。

我使用了org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4,但是没有运气。有没有简单的方法来解决这个问题?

最佳答案

Apache commons-lang库具有StringEscapeUtils类,该类具有unescapeHtml()实用程序方法。

String utf8Str = StringEscapeUtils.unescapeHtml(htmlStr);


您可能还需要unescapeXml()

07-26 09:30