我正在将一些 html 转换为纯文本,并且我使用的是 jsoup 的 HtmlToPlainText
。但是,在最近的 jsoup 版本中,不再包含该代码,因为它被认为仅作为示例提供(尽管 HtmlToPlainText javadoc 仍然说它是 jsoup.jar 的一部分)。
除了手动复制或打包该代码作为附加库之外,我还可以使用什么? jsoup 中是否包含替代方案或至少基于 jsoup?
最佳答案
我们最近从 JSoup 切换到 Jericho
return new Source(html).getRenderer().setMaxLineLength(Integer.MAX_VALUE).setNewLine(null).toString();
有了这个 Maven 依赖
<dependency>
<groupId>net.htmlparser.jericho</groupId>
<artifactId>jericho-html</artifactId>
<version>3.4</version>
</dependency>
关于java - HtmlToPlainText 不再包含在 jsoup 中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53640381/