我正在尝试使用CSS选择器从该站点访问日期,但不允许我这样做。我不断收到此错误:AttributeError:'NoneType'对象没有属性'select'
import requests
from bs4 import BeautifulSoup
page = requests.get("https://www.accuweather.com/en/us/san-
antonio/78205/daily-weather-forecast/351198")
soup = BeautifulSoup(page.content, 'html.parser')
daily = soup.find(class_="content-module")
period_tags = daily.select(".date .dow")
periods = [pt.get_text() for pt in period_tags]
periods
我希望输出以清单形式显示网页上的每一天
最佳答案
我只需要一个User-Agent标头。但是,内容是动态生成的,因此您的请求响应html将不同于可以运行javascript的网页上的内容。您可以使用正则表达式从响应中的script
标记中提取所需的信息,然后使用json解析器进行解析
import requests, re , json
headers = {'User-Agent': 'Mozilla/5.0'}
r = requests.get('https://www.accuweather.com/en/us/san-%20antonio/78205/daily-weather-forecast/351198', headers=headers)
p = re.compile(r'var dailyForecast = (.*);')
data = json.loads(p.findall(r.text)[0])
#print(data)
forecasts = {i['dow'] + ' - ' + i['date']:i['day'] for i in data}
print(forecasts)
dows = [i['dow'] for i in data]
print(dows)