我创建了一个xpath表达式,以使标记超出某些html元素。问题是我无法在控制台中打印它。

我希望得到的是使用lxml库连接到标签a的相关html元素。

这是我的尝试:

from lxml.html import fromstring

htmlcontent = """
<div class="post-taglist">
    <div class="grid">
        <a href="/questions/tagged/python"></a>
    </div>
</div>
"""
root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]
print(item)


我想得到的输出:

<a href="/questions/tagged/python"></a>


我怎样才能做到这一点?我使用许多搜索词进行了谷歌搜索,但找不到该问题的任何直接答案。

最佳答案

根据docs尝试执行以下操作:

from lxml.html import fromstring, tostring

htmlcontent = """
<div class="post-taglist">
    <div class="grid">
        <a href="/questions/tagged/python"></a>
    </div>
</div>
"""

root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]

print(tostring(item).strip())


结果是:

<a href="/questions/tagged/python"></a>

关于python - 无法使用lxml将html元素连接到某个标签,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53669114/

10-09 19:37