能否请任何人推荐能够执行与这些库相反的功能的库?

HtmlCleaner,TagSoup,HtmlParser,HtmlUnit,jSoup,jTidy,nekoHtml,WebHarvest或Jericho。

我需要构建html页面,从String内容构建DOM模型。

编辑:我需要它用于测试目的。我在各种位置的html页面中都有各种类型的输入/字符串...因此,我需要动态地构建它...然后,我根据必须满足或不满足的各种标准来处理html页面。

我将向您展示为什么我问这个问题,为此工作考虑使用htmlCleaner:

List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();

TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {
    TagNode p = new TagNode("p");
    pNodes.add(p);
    // CANNOT setText() ?
}
html.addChildren(pNodes);

问题在于TagNode具有getText()方法,但没有setText()方法....

请添加更多有关此问题的模糊程度的评论。您可以做的最好的事情

最佳答案

Jsoup,Jsoup,Jsoup!我已经使用了所有这些,从长远来看,这是我的最爱。您可以使用它来构建文档,此外,它带来了很多Jquery样式遍历的魔力以及迄今为止我在Java库中看到的最佳HTML文档解析。我对此感到非常满意,以至于我不介意无耻地推广它。 ;)

10-08 00:05