我必须从给定的代码中提取a href值

<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href=​"#src1" onclick=​"dosomething;​" title=​"1" >​1​</a>​</sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..

</table>


我的代码是

 for(Element info: div3.select("tr")){
 Elements aqInfo= companyB.select("td")
 String href=aqInfo.text();
 }


href仅给我提供文本,而不是标签内的文本

如何在sup标签内获取text和href标签?

编辑:我意识到页面源看起来像这样

<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>


firefox中的“检查元素”在<a>中显示了<sup>,我需要该<a>的内容。
如果我错了,请纠正我,但我认为Jsoup.connect(url).get();提供了源文档,Inspect元素提供了当前加载的页面。页面完全加载后,有什么方法可以检索页面吗?

最佳答案

试试这个:

Element mySup= doc.select("sup.super").first();
String linkHref = mySup.child(0).attr("href");
String linkVal = mySup.child(0).text();


说明:

选择具有sup标签和super类的元素
访问其第一个子a标记,然后访问其href属性

从所有href中获取所有text inside the aa

Elements links = doc.select("a[href]");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

09-30 17:52
查看更多