您现在的位置是：首页 > 后端

当前栏目

python:爬取王者荣耀英雄皮肤海报!

Python 爬取荣耀王者英雄皮肤海报

2023-09-27 14:22:47 时间

运行代码如下:

import urllib.request
import re


url = 'https://pvp.qq.com/web201605/herolist.shtml'
a = urllib.request.urlopen(url) 
a = a.read() 
a = a.decode('gbk')  

a = (re.compile('输入英雄不存在，请重新输入' + "(.*?)" + '英雄介绍', re.S).findall(a))[0] 
id = re.compile('<li><a href="herodetail/' + '(.*?)' + '.shtml"', 	re.S).findall(a)  
name = re.compile('height="91" alt="' + '(.*?)' + '">').findall(a)  
print('本次共抓取到' + str(len(id)) + '个英雄数据')

r = True
while r:
f = input('请输入想要保存的路径：')
if f == '':
    print('不能为空')
if f != '':
    r = False


i = 0
for i in range(0, len(id) + 1): 
print('正在下载' + name[i])
url1 = 'https://pvp.qq.com/web201605/herodetail/' + id[i] + '.shtml' 
url1 = ((urllib.request.urlopen(url1)).read()).decode('gbk')  
pf = re.compile('data-imgname="' + '(.*?)' + '">', re.S).findall(url1)  
pf = pf[0]

pf = pf.replace('&', '', )
pf = pf.replace('0', '', )
pf = pf.replace('1', '', )
pf = pf.replace('2', '', )
pf = pf.replace('3', '', )
pf = pf.replace('4', '', )
pf = pf.replace('5', '', )
pf = pf.replace('6', '', )
pf = pf.replace('7', '', )
pf = pf.replace('8', '', )
pf = pf.replace('9', '', )

pf = pf.split('|')
print(pf)

for i1 in range(0, len(pf)):  
    print(name[i] + '-' + pf[i1])
    url2 = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + id[i] + '/' + id[i] + '-bigskin-' + str(
        i1 + 1) + '.jpg' 
    urllib.request.urlretrieve(url2, f + '/' + name[i] + '-' + pf[i1] + '.jpg')

结果图片: 在这里插入图片描述

猜你喜欢

【BZOJ】1025: [SCOI2009]游戏（置换群+dp+特殊的技巧+lcm）
深入浅出 Koa
OpenSceneGraph in ActiveX by ActiveQt
error: 无法连接到Web服务器“IIS Express”
kryo反序列化问题 com.esotericsoftware.kryo.KryoException: Encountered unregistered class ID: 48
Linux宕机最安全的重启方法(你肯定不知道)
Android开发者应该会哪些东西才不会被公司淘汰？全网疯传
PrintWriter 和 BufferedWriter 写入文件.
MyBatis的增删改查操作
[SpringBoot系列]基础过渡与夯实(创建Boot项目的新方式、Boot简化核心)
MYSQL中数据类型介绍
解决tomcat使用时catalina.out过大的问题
099 复习：中值定理习题之型二：有ξ，有a，b ，型三：有ξ，η
PHP实现IOC依赖注入
NLP-生成模型-2014：Seq2Seq【缺点：①解码器无法对齐编码器（Attention机制）；②编码器端信息过使用或欠使用（Coverage机制）；③解码器无法解决OOV（Pointer机制）】

相关主题

python之OS编程
「Python」正则表达式
Python压缩文件
python--装饰器

zl程序教程

当前栏目

python:爬取王者荣耀英雄皮肤海报!

相关文章