我必须从给定的代码中提取a href值
<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href="#src1" onclick="dosomething;" title="1" >1</a></sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..
</table>
我的代码是
for(Element info: div3.select("tr")){
Elements aqInfo= companyB.select("td")
String href=aqInfo.text();
}
href仅给我提供文本,而不是标签内的文本
如何在sup标签内获取text和href标签?
编辑:我意识到页面源看起来像这样
<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>
firefox中的“检查元素”在
<a>
中显示了<sup>
,我需要该<a>
的内容。如果我错了,请纠正我,但我认为
Jsoup.connect(url).get();
提供了源文档,Inspect元素提供了当前加载的页面。页面完全加载后,有什么方法可以检索页面吗? 最佳答案
试试这个:
Element mySup= doc.select("sup.super").first();
String linkHref = mySup.child(0).attr("href");
String linkVal = mySup.child(0).text();
说明:
选择具有
sup
标签和super
类的元素访问其第一个子
a
标记,然后访问其href
属性从所有
href
中获取所有text inside the a
和a
Elements links = doc.select("a[href]");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}