我想使用 python urllib2
从网站保存一些图像,但是当我运行代码时,它会保存其他内容。
这是我的代码:
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
url = "http://m.jaaar.com/"
r = urllib2.Request(url, headers=headers)
page = urllib2.urlopen(r).read()
soup = BeautifulSoup(page)
imgTags = soup.findAll('img')
imgTags = imgTags[1:]
for imgTag in imgTags:
imgUrl = "http://www.jaaar.com" + imgTag['src']
imgUrl = imgUrl[0:-10] + imgUrl[-4:]
fileName = "khabarnak-" + imgUrl[-12:]
print fileName
imgData = urllib2.urlopen(imgUrl).read()
print imgUrl
output = open("C:\wamp\www\py\pishkhan\\" + fileName,'wb')
output.write(imgData)
output.close()
有什么建议么?
最佳答案
该站点将标准图像返回给您,因为您正在抓取该站点。检索图像时使用相同的“技巧”设置标题:
imgRequest = urllib2.Request(imgUrl, headers=headers)
imgData = urllib2.urlopen(imgRequest).read()
关于python - 无法使用 urllib2 从网络保存图像,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14439809/