我想得到第一个标题并打印出来。到目前为止,我已经浏览了HTML并找到了一种搜索标题的方法。
data-pb-placeholder="Write headline here"
该代码通常在我想要的任何标题之前。到目前为止,我有...
Document doc = Jsoup.connect("http://www.washingtonpost.com").get();
Element headline = doc.select("headline").first();
System.out.println(headline);
它仅输出null。我不确定如何搜索文档并查找标题。
最佳答案
标题似乎都在<div class="headline">
下。您可以使用CSS selectors定位这些对象并提取其文本节点。
Document doc = Jsoup.connect("http://www.washingtonpost.com").get();
for (Element headline : doc.select("div.headline"))
System.out.println(headline.text());