我正在尝试抓取此页面:

http://www.barb.co.uk/viewing-data/weekly-top-30/

我正在尝试使用以下数据填写表格:

station=BBC2 (SD+HD)
year=2016
month=January
week=11 Jan - 17 Jan


所以这就是我尝试的:

import requests
import json
url='http://www.barb.co.uk/viewing-data/weekly-top-30/'
payload= {
    'station[]':['2'],
    'period_year[]':  ['2016'],
    'period_month[]': ['1'],
    'period_week[]': ['201601060117']
}
session=requests.session()
r=requests.post(url,data=payload)
with open ('html_res.html','w') as f:
    f.write(str(r.content))


html_res.html中,我没有获得所需的数据。
我想知道我在做什么错。
谢谢。

最佳答案

使用此代码。

import requests
import json

headers = {
    'Origin': 'http://www.barb.co.uk',
    'Accept-Encoding': 'gzip, deflate',
    'Accept-Language': 'en-US,en;q=0.8,he;q=0.6',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
    'Accept': '*/*',
    'Referer': 'http://www.barb.co.uk/viewing-data/weekly-top-30/',
    'Connection': 'keep-alive',
}

data = [
  ('method', 'POST'),
  ('station[]', '839'),
  ('period[]', '201710060108'),
]

r = requests.post('http://barb-api.mediatel.co.uk//whats-new/weekly-top-30', headers=headers, data=data)
print(json.dumps(r.json(),indent=2))


您可以使用this网站将curl转换为python代码。

09-25 19:58