您现在的位置是：首页 > 后端

当前栏目

python 并发爬虫的快感

Python 爬虫并发

2023-09-14 09:06:37 时间

import time
from tomorrow import threads
from requests_html import HTMLSession
session=HTMLSession()
@threads(50)  # 使用装饰器，这个函数异步执行
def download(url):
    return session.get(url)


def main():
    start = time.time()
    urls = [
        'https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',
        'https://www.cnblogs.com/pyld/p/4716744.html',
        'http://www.xicidaili.com/nn/10',
        'http://baidu.com',
        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879'
    ]
    req_list=[]
    for i in urls:
        req_list.append(download(i))
    print(req_list)
    responses = [i.html.xpath("//title/text()") for i in req_list]
    print(responses)
    end = time.time()
    print("Time: %f seconds" % (end - start))


if __name__ == "__main__":
    main()

猜你喜欢

featureOracle新特性：突破性的变革（oraclenew）
深入了解Oracle触发器的不同类型（oracle触发器类型）
IKAnalyzer2012FF + Lucene4.9 TokenStream contract violation: reset()/close() call missing
警惕Redis Map的频繁变更（redis频繁修改map）
MySQL的默默转变：解开谜题（mysql隐式转换）
Redis给数据存储提供更强有力的保障（redis说法正确）
为什么HTTP REST比RPC更受欢迎｜微服务
计算机网络基础--双路由器ping通pc1pc2
虚拟opc服务器软件,几个OPC服务器开发工具比较
秸秆焚烧视频监控系统
Dapr 入门教程之消息队列
MySQL Error number: 3525; Symbol: ER_OPEN_ROLE_TABLES; SQLSTATE: HY000 报错故障修复远程处理
MySQL实现交叉连接的简洁方法（mysql交叉连接）
.Net搭配Redis解决高性能应用问题（.net redis）
racMySQL提取：从技术转变的奇迹（mysqlext）
MySQL轻松上传到OSS，高效存储管理（mysql上传oss）
MySQL占用内存过大解决方案图文详解
Go-Excelize API源码阅读（二十二）——SetAppProps(appProperties *AppProperties)
功能Oracle中函数实现复杂查询游标助您实现（oracle中函数带游标）
Redis实现订阅通知服务实践与探索（redis订阅通知服务）
Oracle临时表路径掌握这一重要知识点（oracle临时表路径）

相关主题

Python爬虫
python爬虫案例
Python常见题
python resize
python-爬虫
python中的异常
[python爬虫] 百度贴吧
Python标准库介绍
Python爬虫示例
python 爬图片
Python中的yield
python 实例六

zl程序教程

当前栏目

python 并发爬虫的快感

相关文章