我正在使用beautifuldsoup,并试图获取页面上属性等于某个字符串的第一个标记。
例如:
<a href="url" title="export"></a>
我一直在尝试的是获取第一个找到的标题为“导出”的文件的ref。
如果我使用
soup.select("a[title='export']")
,那么我最终会找到满足此要求的所有标记,而不仅仅是第一个。如果我使用
find("a", {"title":"export"})
时设置的条件是标题应该等于“export”,那么它将获取标记中的实际项目,而不是ref。如果我在打过电话后再写,我就一个也回不来了。
我一直在搜索文档和堆栈溢出以寻找答案,但还没有找到答案。有人知道解决这个问题的办法吗?谢谢您!
最佳答案
我一直在尝试的是获取第一个找到的标题为“导出”的文件的ref。
你就快到了。您需要做的就是,一旦您获得了标记,您只需要对它进行索引,就可以获得该ref。这里有一个更防弹的版本:
try:
url = soup.find('a', {'title' : 'export'})['href']
print(url)
except TypeError:
pass