我试图在循环中从每个容器中获取唯一信息。我正在使用python 3.7和BeautifulSoup进行抓取。
我遇到了一个问题,我试图获得唯一的玩家ID号。
这是数字嵌套的标记:
<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>
我已经尝试过a.split()将标签变成列表,我可以在其中标出我想要的数据,但这不起作用。
我试图使用选择功能。 a.select(“ playerid”),但得到这样的空括号[]。
任何帮助是极大的赞赏!谢谢。
最佳答案
您也可以使用以下语法
from bs4 import BeautifulSoup as bs
h = '<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>'
soup = bs(h,'lxml')
print(soup.select_one('a[playerid]')['playerid'])