您现在的位置是：首页 > 后端

当前栏目

图集谷-写真集-爬虫-2.1「建议收藏」

爬虫建议收藏 2.1 图集写真集

2023-06-13 09:12:47 时间

大家好，又见面了，我是你们的朋友全栈君。

为了使爬虫代码更加扁平化，因此，我对2.0版本爬虫进行了一定的修改。

话不多说，请看代码。

# 导入库
import os, time, requests
 
# 请求头
headers = {
  'User-Agent': 'Chrome 10.0'
}
 
# 图片数据列表
pictures = []
 
# 获取图片数据
def get_pic(url, nums):
    for num in range(0, int(nums)):
        url_all = str(url) + f'{str(num)}.jpg'
        res = requests.get(url=url_all, headers=headers)
        pic_content = res.content
        pictures.append(pic_content)
        time.sleep(0.5)
 
# 创建目的文件夹
def get_path(path_name):
    if not os.path.exists(f'C:/Users/liu/Desktop/图集/{path_name}'):
        os.mkdir(f'C:/Users/liu/Desktop/图集/{path_name}')
    else:
        pass
 
# 保存图片数据
def save_data():
    for pic,i in zip(pictures, range(int(Num))):
        picture = open(f'C:/Users/liu/Desktop/图集/{str(Page_Num)}/{str(i)}.jpg', 'wb')
        picture.write(pic)
        picture.close()
# 主函数，调用函数
def main():
    url = f'https://tjg.gzhuibei.com/a/1/{str(Page_Num)}/'    # 传入网页数据
    get_path(path_name=Page_Num)
    get_pic(url=url, nums=Num)
    save_data()
 
# 主程序入口
if __name__ == '__main__':
    Page_Num = input('Enter the Page_name:')    # Page_Num指下文url所代指的数字
    Num = int(input('Enter the Num:')) + 1    # Num为写真集的图片数
    print('Finish!')

大家有任何疑问，都可以在下面评论区进行留言，我会不定时的对评论进行回复。

感谢大家的支持！

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/157826.html原文链接：https://javaforall.cn

猜你喜欢

vue3+vite项目中启用pwa
Redis协议双向数据交换的基础（什么是redis协议）
JavaScript获得选中文本内容的方法
【ACM】喷水装置详解编程语言
哨兵Redis算法实现稳定高效数据访问（哨兵redis算法）
，Linux 配置文件优化：成功改变游戏规则！（linux修改配置文件后）
Redis用于简单聊天的答案（redis适合做聊天吗）
不盲从不掉队，我们找了20篇最值得读的数字化转型文章
NOIP 2008 普及组传球游戏「建议收藏」
利用Oracle实现两个数相加（oracle 两个数相加）
深入了解Oracle索引和函数的使用（oracle索引函数）
增长Oracle中国区销售大增，开创新纪元（oracle中国区销售）
Linux给我们带来新的改变（linux了.sh）
TRICONEX 6301 提供重要的流程数据方面存在困难

zl程序教程

当前栏目

图集谷-写真集-爬虫-2.1「建议收藏」

相关文章