jsoup  Java HTML Parser


jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据

HTMLParser 太小众,连官方文档都太少,中文的更少

不知道jsoup是不是把整个页面都解析成DOM树了,如果是这样可能会有一点点慢,同事说他那个爬新浪页面的爬虫项目,用jsoup满足得了客户需求
jsoup把整个页面都解析成DOM树




05-11 22:23