我想得到第一个标题并打印出来。到目前为止,我已经浏览了HTML并找到了一种搜索标题的方法。

data-pb-placeholder="Write headline here"


该代码通常在我想要的任何标题之前。到目前为止,我有...

Document doc = Jsoup.connect("http://www.washingtonpost.com").get();
Element headline = doc.select("headline").first();
System.out.println(headline);


它仅输出null。我不确定如何搜索文档并查找标题。

最佳答案

标题似乎都在<div class="headline">下。您可以使用CSS selectors定位这些对象并提取其文本节点。

    Document doc = Jsoup.connect("http://www.washingtonpost.com").get();

    for (Element headline : doc.select("div.headline"))
        System.out.println(headline.text());

10-08 06:57