我创建了一个xpath表达式,以使标记超出某些html元素。问题是我无法在控制台中打印它。
我希望得到的是使用lxml库连接到标签a
的相关html元素。
这是我的尝试:
from lxml.html import fromstring
htmlcontent = """
<div class="post-taglist">
<div class="grid">
<a href="/questions/tagged/python"></a>
</div>
</div>
"""
root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]
print(item)
我想得到的输出:
<a href="/questions/tagged/python"></a>
我怎样才能做到这一点?我使用许多搜索词进行了谷歌搜索,但找不到该问题的任何直接答案。
最佳答案
根据docs尝试执行以下操作:
from lxml.html import fromstring, tostring
htmlcontent = """
<div class="post-taglist">
<div class="grid">
<a href="/questions/tagged/python"></a>
</div>
</div>
"""
root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]
print(tostring(item).strip())
结果是:
<a href="/questions/tagged/python"></a>
关于python - 无法使用lxml将html元素连接到某个标签,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53669114/