我正在将一些 html 转换为纯文本,并且我使用的是 jsoup 的 HtmlToPlainText 。但是,在最近的 jsoup 版本中,不再包含该代码,因为它被认为仅作为示例提供(尽管 HtmlToPlainText javadoc 仍然说它是 jsoup.jar 的一部分)。

除了手动复制或打包该代码作为附加库之外,我还可以使用什么? jsoup 中是否包含替代方案或至少基于 jsoup?

最佳答案

我们最近从 JSoup 切换到 Jericho

return new Source(html).getRenderer().setMaxLineLength(Integer.MAX_VALUE).setNewLine(null).toString();

有了这个 Maven 依赖
<dependency>
    <groupId>net.htmlparser.jericho</groupId>
    <artifactId>jericho-html</artifactId>
    <version>3.4</version>
</dependency>

关于java - HtmlToPlainText 不再包含在 jsoup 中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53640381/

10-12 14:03