我试图在循环中从每个容器中获取唯一信息。我正在使用python 3.7和BeautifulSoup进行抓取。

我遇到了一个问题,我试图获得唯一的玩家ID号。

这是数字嵌套的标记:

<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>


我已经尝试过a.split()将标签变成列表,我可以在其中标出我想要的数据,但这不起作用。

我试图使用选择功能。 a.select(“ playerid”),但得到这样的空括号[]。

任何帮助是极大的赞赏!谢谢。

最佳答案

您也可以使用以下语法

from bs4 import BeautifulSoup as bs
h = '<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>'
soup = bs(h,'lxml')
print(soup.select_one('a[playerid]')['playerid'])

10-08 06:56