如何使用Jsoup分别从this website中提取每行的规格数据,例如Network->Network Type,Battery等。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class mobilereviews {
    public static void main(String[] args) throws Exception {
        Document doc = Jsoup.connect("http://mobilereviews.net/details-for-Motorola%20L7.htm").get();
        for (Element table : doc.select("table")) {
            for (Element row : table.select("tr")) {
                Elements tds = row.select("td");
                System.out.println(tds.get(0).text());
            }
        }
    }
}

最佳答案

列的xpath-//*[@id="phone_details"]/tbody/tr[3]/td[2]/strong
值的xpath-//*[@id="phone_details"]/tbody/tr[3]/td[3]
@乔伊的密码试图把重点放在这些上。您应该能够基于Xpath编写select()规则。
用适当的值替换数字(tr[N]/td[N])。
或者,您可以将HTML作为纯文本浏览器进行处理,并从文本中提取数据。这是这一页的text version。您可以分隔文本或在N个字符后读取以提取数据。

关于java - 使用Jsoup提取和解析HTML表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15853002/

10-16 19:37