python:爬取王者荣耀英雄皮肤海报!
Python 爬取 荣耀 王者 英雄 皮肤 海报
2023-09-27 14:22:47 时间
运行代码如下:
import urllib.request
import re
url = 'https://pvp.qq.com/web201605/herolist.shtml'
a = urllib.request.urlopen(url)
a = a.read()
a = a.decode('gbk')
a = (re.compile('输入英雄不存在,请重新输入' + "(.*?)" + '英雄介绍', re.S).findall(a))[0]
id = re.compile('<li><a href="herodetail/' + '(.*?)' + '.shtml"', re.S).findall(a)
name = re.compile('height="91" alt="' + '(.*?)' + '">').findall(a)
print('本次共抓取到' + str(len(id)) + '个英雄数据')
r = True
while r:
f = input('请输入想要保存的路径:')
if f == '':
print('不能为空')
if f != '':
r = False
i = 0
for i in range(0, len(id) + 1):
print('正在下载' + name[i])
url1 = 'https://pvp.qq.com/web201605/herodetail/' + id[i] + '.shtml'
url1 = ((urllib.request.urlopen(url1)).read()).decode('gbk')
pf = re.compile('data-imgname="' + '(.*?)' + '">', re.S).findall(url1)
pf = pf[0]
pf = pf.replace('&', '', )
pf = pf.replace('0', '', )
pf = pf.replace('1', '', )
pf = pf.replace('2', '', )
pf = pf.replace('3', '', )
pf = pf.replace('4', '', )
pf = pf.replace('5', '', )
pf = pf.replace('6', '', )
pf = pf.replace('7', '', )
pf = pf.replace('8', '', )
pf = pf.replace('9', '', )
pf = pf.split('|')
print(pf)
for i1 in range(0, len(pf)):
print(name[i] + '-' + pf[i1])
url2 = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + id[i] + '/' + id[i] + '-bigskin-' + str(
i1 + 1) + '.jpg'
urllib.request.urlretrieve(url2, f + '/' + name[i] + '-' + pf[i1] + '.jpg')
结果图片:
相关文章
- 用 Python 爬虫框架 Scrapy 爬取心目中的女神
- Python中的变量和数据类型
- Python socket(TCP阻塞模式)基础程式
- python爬虫知识点总结(九)Requests+正则表达式爬取猫眼电影
- Python爬虫爬取动态页面思路+实例(二)
- OpenCV读取图片、判断读取是否成功、显示图片的代码(C++代码和Python代码)
- 精通Python网络爬虫:核心技术、框架与项目实战.1.4 网络爬虫的类型
- Python爬虫:用BeautifulSoup进行NBA数据爬取
- python爬虫爬取淘宝网页
- Python爬取infobox内容并保存为三元组
- Python爬虫入门实战项目--爬取新笔趣阁小说
- Python--爬虫爬取优美图库--bs4(BeatifulSoup)入门
- Python 生成哈希hash--hashlib模块
- python之获取微信服务器的ip地址
- 《Python游戏编程快速上手》一2.2 计算表达式
- 《Python数据可视化编程实战》—— 1.2 安装matplotlib、Numpy和Scipy库
- 使用Python爬虫爬取网络美女图片
- python 爬取王者荣耀高清壁纸
- 萌新学习Python爬取B站弹幕+R语言分词demo说明
- 【Python行业分析】BOSS直聘招聘信息获取之使用webdriver进行爬取
- 16. python爬虫——基于scrapy爬取多页面新闻信息,通过请求传参完成持久化存储
- Python 爬虫 之 爬取古代的诗歌,并保存本地(这里以爬取李白的所有诗歌为例)(以备作为AI写诗的训练数据)
- Python中的Numpy入门教程
- Python语言Web开发框架web2py
- Python入门学习笔记第六章——字典~~~