如何使用Jsoup分别从this website中提取每行的规格数据,例如Network->Network Type,Battery等。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class mobilereviews {
public static void main(String[] args) throws Exception {
Document doc = Jsoup.connect("http://mobilereviews.net/details-for-Motorola%20L7.htm").get();
for (Element table : doc.select("table")) {
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
System.out.println(tds.get(0).text());
}
}
}
}
最佳答案
列的xpath-//*[@id="phone_details"]/tbody/tr[3]/td[2]/strong
值的xpath-//*[@id="phone_details"]/tbody/tr[3]/td[3]
@乔伊的密码试图把重点放在这些上。您应该能够基于Xpath编写select()
规则。
用适当的值替换数字(tr[N]/td[N])。
或者,您可以将HTML作为纯文本浏览器进行处理,并从文本中提取数据。这是这一页的text version。您可以分隔文本或在N个字符后读取以提取数据。
关于java - 使用Jsoup提取和解析HTML表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15853002/