前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~!
环境使用:
-
Python 3.8
-
Pycharm
模块使用:
-
requests —> 数据请求模块 需要安装
-
re 正则表达式 内置模块 不需要安装
-
os 文件操作模块 内置模块 不需要安装 --> 自动创建文件夹 把每个英雄都自动创建对应文件
第三方模块安装:
-
win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
-
在pycharm中点击Terminal(终端) 输入安装命令
如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:
pip install -i https://pypi.doubanio.com/simple/ requests
代码基本四个步骤:
-
发送请求, 模拟浏览器对于url地址发送请求
-
获取数据, 获取服务器返回响应数据
-
解析数据, 提取我们想要的数据内容
-
保存数据, 把需要数据保存到本地
代码展示
import os.path
# 导入数据请求模块
import requests
# 导入正则表达式
import re
模拟浏览器
headers = {
# User-Agent 用户代理 表示浏览器基本身份信息
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
英雄列表数据包 ctrl + /
html = 'https://*****/web201605/js/herolist.json'
发送请求 response.json() 获取响应的json数据
json_data = requests.get(html, headers=headers).json()
for index in json_data:
# 键值对取值
HeroName = index['cname'] # 英雄名字
HeroID = index['ename'] # 英雄ID
请求url地址 yao 英雄详情页
url = f'https://*****/web201605/herodetail/{HeroID}.shtml'
# 发送请求
response = requests.get(url, headers=headers)
"""
# 转码
response.encoding = 'gbk'
# 提取名字
name_list = re.findall('data-imgname="(.*?)">', response.text)[0].split('|')
# 给数字
num = 1
# 一个一个提取名字
for name in name_list:
# 名字处理
name = name.split('&')[0]
# 图片链接:
link = f'https://*****/images/yxzj/img201606/skin/hero-info/{HeroID}/{HeroID}-bigskin-{num}.jpg'
filename = f'img\\{HeroName}\\'
if not os.path.exists(filename):
os.makedirs(filename)
# 二进制数据获取
img_content = requests.get(link, headers=headers).content
with open(filename + name + '.jpg', 'wb') as f:
f.write(img_content)
# 每次循环都加1
num += 1
print(link, name)
尾语
感谢你观看我的文章呐~本次航班到这里就结束啦 🛬
希望本篇文章有对你带来帮助 🎉,有学习到一点知识~
躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。
最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇