您现在的位置是：首页 > 其他

当前栏目

充满热点的美女“宅舞“视频每天都在更新,这不得批量爬下来慢慢看~

批量更新视频每天热点美女不得充满

2023-09-14 09:05:36 时间

前言

嗨喽！大家好呀~这里是魔王

本次所需知识点：

requests
post请求方式
开发者工具的使用

所使用开发环境:

版本: python 3.8
编辑器: pycharm 2021.2

思路分析

第一个步骤 (找到数据来源)

代码实现:

发送请求
获取数据
解析数据
保存数据

代码

代码一些网址被我删了，可看左侧主页领取，也可私聊我领取完整代码

import requests     # 发送请求

headers = {
    'cookie': 'SUB=_2AkMWuiaof8NxqwJRmfEcxW7kZYV1zQHEieKg5tdzJRMxHRl-yT8XqmlbtRB6PToIR8vzOUazMyBaDx1yoAhoGvmhBh2R; SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9WFhP5UbeyRGEMWCEO66rKKN; SINAGLOBAL=4378435525987.705.1642506657635; UOR=,,www.baidu.com; YF-V-WEIBO-G0=35846f552801987f8c1e8f7cec0e2230; _s_tentry=www.baidu.com; Apache=4202086709610.053.1651127548346; ULV=1651127548462:5:1:1:4202086709610.053.1651127548346:1647671293014; XSRF-TOKEN=-zQTQde7oNPbwv2z7IZNWn7x; WBPSESS=5Gh1MjbHbWED7wnbzL0HessirGvmylijYYvflqusiD9GEsQ6rqnU_tJ77BAIaB7ziYAGd2bn8bjGxvzctVcMOww-G_WpuVuFa86yECy9FyzCc1G6phFPW88j0AwEPWrz',
    'origin': '',
    'page-referer': '/tv/show/1034:4762666296868953',
    'referer': '',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36',
    'x-xsrf-token': '-zQTQde7oNPbwv2z7IZNWn7x'
}
def get_next(next_cursor):
    list_data = {
        'data': '{"Component_Channel_Subchannel":{"cid":"4379160563414139"}}'
    }
    if next_cursor != '':
        list_data = {
            'data': '{"Component_Channel_Subchannel":{"next_cursor":'+str(next_cursor)+',"cid":"4379160563414139"}}'
        }
   
    list_url = ''
    list_json = requests.post(list_url, headers=headers, data=list_data).json()
    if list_json['data']['Component_Channel_Subchannel'] == None:
        return 0
    data_list = list_json['data']['Component_Channel_Subchannel']['list']
    next_cursor = list_json['data']['Component_Channel_Subchannel']['next_cursor']
    for dat_ in data_list:
        oid = dat_['oid']
        data = {
            'data': '{"Component_Play_Playinfo":{"oid":"'+oid+'"}}'
        }
        url = '' + oid
        # 1. 发送请求
        response = requests.post(url=url, data=data, headers=headers)
        # 2. 获取数据
        json_dict = response.json()
        # 3. 解析数据
        try:
            dict_urls = json_dict['data']['Component_Play_Playinfo']['urls']
            video_url = 'https:' + dict_urls[list(dict_urls.keys())[0]]
            title = json_dict['data']['Component_Play_Playinfo']['title']
            media_id = json_dict['data']['Component_Play_Playinfo']['media_id']
            title = str(media_id) + title
            print(title, video_url)
            # 4. 保存数据
            # video_data = requests.get(video_url).content
            # with open(f'video/{title}.mp4', mode='wb') as f:
            #     f.write(video_data)
        except:
            print('视频违规,已下架!')
    get_next(next_cursor)

get_next('')

尾语

好了，我的这篇文章写到这里就结束啦！

有更多建议或问题可以评论区或私信我哦！一起加油努力叭(ง •_•)ง

喜欢就关注一下博主，或点赞收藏评论一下我的文章叭！！！

猜你喜欢

MySQL Status Mysqlx_stmt_enable_notices 数据库状态作用意思及如何正确
自动驾驶激活工业无人机
jquery之Document元素选择器篇
2022RubyMine激活码(2022RubyMine最新激活码)2022RubyMine激活码
FTP协议的工作流程
MySQL时间戳：13位在准确度上更高（mysql13位时间戳）
Oracle表空间扩容解决碎片问题（oracle为表空间扩容）
ORACLE软件下载之路测验你的技术（ORACLE下载软件测试）
JSonmousemove鼠标移动坐标接龙DIV效果实例
机器学习笔记引言
asp.net运行提示未将对象引用设置到对象的实例错误解决方法
关闭Redis几种简单方法（如何关掉redis）

相关主题

Python批量修改文件名
批量替换字符串
mysql批量更新数据
bat批量重命名
批量建表
批量部署系统
mysql-批量更新

zl程序教程