本文介绍了jsoup来获取无序列表中的数据的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在使用JSOUP提取数据.我有一个html文件:

I am using JSOUP to extract the data.I have a html file:

=
<ul>
<li>
<i>
<a class="Class1" title="title1" href=""www.title1.com">title1</a>
</i>
(one)
</li>
<li>
<i>
<a title=title2" href="www.title2.com">title2</a>
</i>
(two)
</li>
<li>
<i>
<a title="title3" href=""www.title2.com">title3</a>
</i>
(three)
</li>
</ul>

如何使用JSOUP打印title1,title2和title3,2)如何打印hrefs?

How to use JSOUP to print title1,title2 and title3,2) How to print the hrefs?

推荐答案

非常简单:

Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String title1 = link.attr("title");

//etc.

您是否已经在此处了?

还要确保HTML 格式正确.例如匹配的报价

Also make sure the HTML is well formed. e.g. matching quotes

上面的HTML输出格式不正确,例如:

The HTML output above is not well formed, for instance:

<a class="Class1" title="title1" href=""www.title1.com">title1</a>
                                       ^ extra quote

<a title=title2" href="www.title2.com">title2</a>
         ^ missing quote

JSoup 需要有效的HTML.

JSoup requires valid HTML.

这篇关于jsoup来获取无序列表中的数据的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-05 12:07