python - 多线程下载m3u8
2023-04-18 15:51:25 时间
import requests
import m3u8
import os
from multiprocessing.dummy import Pool
from tqdm import tqdm
from retry import retry
from urllib.parse import urljoin
@retry(tries=3, delay=2) # 重试3次, 间隔2s
def download(i, url):
res = requests.get(url,stream=True)
with open(f"./{i}.ts", "wb") as f:
f.write(res.content)
def merge(total):
with open("./test.mp4", "ab") as f:
for i in range(total):
try:
path = f"./{i}.ts"
content = open(path, "rb").read()
f.write(content)
os.remove(path)
except Exception as e:
print(e)
url = "https://vip.lz-cdn14.com/20220812/7879_a40a495a/1200k/hls/index.m3u8"
m3u8_data = m3u8.load(url).data
ts_list = []
for i in range(len(m3u8_data["segments"])):
ts_list.append(urljoin(url, m3u8_data["segments"][i]["uri"]))
total = len(ts_list)
pbar = tqdm(total=total)
pbar.set_description("进度条")
update = lambda *args: pbar.update()
if __name__ == "__main__":
pool = Pool(64)
for i in range(total):
if not os.path.exists(f"./{i}.ts"):
pool.apply_async(download, args=(i, ts_list[i],), callback=update)
pool.close()
pool.join() # 阻塞主线程
merge(total)
效果如下
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击