我有一个类似的html文件
<div class="student">
<h4 id="Classnumber100" class="studentheading">
<a id="studentlink22" href="/grade8/greg">22. Greg</a>
</h4>
<div class="studentcategories">
<div class="studentneighborhoods">
</div>
</div>
</div>
我想使用JSOUP来获取url = / grade8 / greg和“ 22. Greg”。
我尝试了选择器
Elements listo = doc.select("h4 #studentlink22");
我无法获取这些值。
其实我想根据Classnumber100选择
HTML页面中有300条记录,唯一一致的是“ Classnumber100。
因此,我希望选择器选择classnumber100之后的所有href和文本。
我怎样才能做到这一点。
我试过了
doc.select(“ class#studentheading”);和许多其他可能性,但它们不起作用
最佳答案
首先,多个元素不应共享相同的ID,因此,每个元素都不应具有ID Classnumber100
。但是,在这种情况下,您仍然可以使用选择器[id=Classnumber100]
选择它们。
如果您只对其中的a
标记感兴趣,则可以使用[id=Classnumber100] > a
。
重新阅读问题后,您感兴趣的h4
标记似乎共享了class
的studentheading
属性。在这种情况下,您可以使用类选择器,即
doc.select(".studentheading > a")