我有一个使用BeautifulSoup来查找某个类的所有信息的脚本,我想获取标签的文本。

我的意思是:

<a href="/weather">Weather</a>


在显示Weather的href之后获取文本。

每个标签都在我正在使用的div中

blank = soup.findAll(attrs={"blank"})


我要全班回来了。

我尝试使用.decode_contents()但:

我希望在每个元素上执行该操作,并且根据我看到的.decode_contents,您需要在列表中指定要对其执行的元素。

它仍然返回整个类和<a>元素,而不仅仅是返回我想要的“天气”。

我如何只在<a>标记中找到文本并将其返回到控制台?

最佳答案

blank = soup.find_all('a')
blank.attrs['href']


这将返回已解析的html数据中所有<a>标记中所有内部文本的列表(空白)。

打印数据:

for blank in soup.find_all("a"):
    print("Inner Text: {}".format(blank.text))

关于python - 在BeautifulSoup中获取HTML <a>标记的文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57342121/

10-10 21:00