我需要一个简单的脚本,可以在其中输入网址,并且可以获取页面中某个html元素的文本。
例如:
内https://www.transfermarkt.co.uk/schnellsuche/ergebnis/schnellsuche?query=Daley+Blind&x=0&y=0
在这种情况下,我需要具有CB的“位置”,并使其控制台登录到我的页面中。
谢谢
最佳答案
您可以简单地将此URL作为字符串,然后使用split方法对字符串进行相应的拆分。
如果网址始终相似,即格式始终相同,那么您可以执行以下操作。
s="https://www.transfermarkt.co.uk/schnellsuche/ergebnis/schnellsuche?query=Daley+Blind&x=0&y=0"
s=s.strip("&")
x=s[-2]
y=s[-1]
x=x.split("=")
y=y.split("=")
xCord=x[-1]
yCord=y[-1]
如果您希望HTML元素形成页面。您可以执行以下操作:
from bs4 import BeautifulSoup
import requests
url="Your url"
source=requests.get(url).text
soup=BeautifulSoup(source,"lxml")
# the div block of element id or even class
element=soup.find('div',id='your id')
print(element)