我有一个使用BeautifulSoup来查找某个类的所有信息的脚本,我想获取标签的文本。
我的意思是:
<a href="/weather">Weather</a>
在显示Weather的href之后获取文本。
每个标签都在我正在使用的div中
blank = soup.findAll(attrs={"blank"})
我要全班回来了。
我尝试使用.decode_contents()但:
我希望在每个元素上执行该操作,并且根据我看到的.decode_contents,您需要在列表中指定要对其执行的元素。
它仍然返回整个类和
<a>
元素,而不仅仅是返回我想要的“天气”。我如何只在
<a>
标记中找到文本并将其返回到控制台? 最佳答案
blank = soup.find_all('a')
blank.attrs['href']
这将返回已解析的html数据中所有
<a>
标记中所有内部文本的列表(空白)。打印数据:
for blank in soup.find_all("a"):
print("Inner Text: {}".format(blank.text))
关于python - 在BeautifulSoup中获取HTML <a>标记的文本,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57342121/