我有这个HTML代码:
<td class="topic starter"><a href="http://www.test.com">Title</a></td>
我想提取“标题”和URL,所以我这样做了:
Elements titleUrl = doc.getElementsByAttributeValue("class", "topic starter");
String title = titleUrl.text();
这适用于标题,但是对于URL,我尝试了以下操作:
String url = titleUrl.html();
String url = titleUrl.attr("a [href]");
String url = titleUrl.attr("a[href]");
String url = titleUrl.attr("href");
String url = titleUrl.attr("a");
但是没人能用,我无法获取URL。
最佳答案
尝试这个:
Element link = doc.select("td.topic.starter > a");
String url = link.attr("href");
首先选择
a
元素,然后提取其属性href
。