能否请任何人推荐能够执行与这些库相反的功能的库?
HtmlCleaner,TagSoup,HtmlParser,HtmlUnit,jSoup,jTidy,nekoHtml,WebHarvest或Jericho。
我需要构建html页面,从String内容构建DOM模型。
编辑:我需要它用于测试目的。我在各种位置的html页面中都有各种类型的输入/字符串...因此,我需要动态地构建它...然后,我根据必须满足或不满足的各种标准来处理html页面。
我将向您展示为什么我问这个问题,为此工作考虑使用htmlCleaner:
List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();
TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {
TagNode p = new TagNode("p");
pNodes.add(p);
// CANNOT setText() ?
}
html.addChildren(pNodes);
问题在于
TagNode
具有getText()
方法,但没有setText()
方法....请添加更多有关此问题的模糊程度的评论。您可以做的最好的事情
最佳答案
Jsoup,Jsoup,Jsoup!我已经使用了所有这些,从长远来看,这是我的最爱。您可以使用它来构建文档,此外,它带来了很多Jquery样式遍历的魔力以及迄今为止我在Java库中看到的最佳HTML文档解析。我对此感到非常满意,以至于我不介意无耻地推广它。 ;)