我正在使用BeautifulSoup4来构建执行财务计算的脚本。我已成功将数据提取到列表中,但只需要元素中的浮点数即可。
例如:
Volume = soup.find_all('td', {'class':'text-success'})
print (Volume)
这给了我清单输出:
[<td class="text-success">+1.3 LTC</td>, <td class="text- success">+5.49<span class="muteds">340788</span> LTC</td>, <td class="text-success">+1.3 LTC</td>,]
我希望它成为:
[1.3, 5.49, 1.3]
我怎样才能做到这一点?
非常感谢您阅读我的文章,我非常感谢我能获得的任何帮助。
最佳答案
您可以在每个td
中找到第一个文本节点,将其按空格分割,获取第一项,然后通过float
将其转换为float()
-+
将自动处理:
from bs4 import BeautifulSoup
data = """
<table>
<tr>
<td class="text-success">+1.3 LTC</td>
<td class="text-success">+5.49<span class="muteds">340788</span> LTC</td>
<td class="text-success">+1.3 LTC</td>
</tr>
</table>"""
soup = BeautifulSoup(data, "html.parser")
print([
float(td.find(text=True).split(" ", 1)[0])
for td in soup.find_all('td', {'class':'text-success'})
])
打印
[1.3, 5.49, 1.3]
。请注意
find(text=True)
如何避免在第二个340788
中提取td
。关于python - 如何从python列表中的元素中提取浮点数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39437366/