您现在的位置是：首页 > 后端

当前栏目

scrapy怎么同时运行多个爬虫？

scrapy 爬虫怎么运行多个同时

2023-09-14 08:59:02 时间

######

可以通过以下几种方式：

1.开启多个命令行，分别执行scrapy cralw xxxx

2.编写一个脚本，写入以下代码，执行工程下的所有爬虫：

from scrapy.utils.project import get_project_settings
from scrapy.crawler import CrawlerProcess

def main():
    setting = get_project_settings()
    process = CrawlerProcess(setting)
    didntWorkSpider = ['sample']

    for spider_name in process.spiders.list():
        if spider_name in didntWorkSpider :
            continue
        print("Running spider %s" % (spider_name))
        process.crawl(spider_name)
    process.start()

3.使用scrapyd，部署爬虫，通过scrapyd的API调用爬虫

4.推荐使用spiderkeeper或者gerapy，这两个提供的WebUI都很好用，个人更喜欢spiderkeeper一些，因为可以定时运行爬虫。

如图:

####

猜你喜欢

MySQL：排除不断重启的困扰（mysql不断重启）
ORA-16095: Dependent destination removal for inactivation ORACLE 报错故障修复远程处理
select标签模拟/美化方法采用JS外挂式插件
海康威视：三季度EBG增速领先，创新业务增长可观
Maven Archetype(原型/模板)
Linux NFS服务器的端口优化（nfslinux端口）
Redis带来的静态缓存福音（redis静态缓存）
初探Linux Awk数组的奥妙（linuxawk数组）
全球首个？竟在中国！
自己写的兼容ie和ff的在线文本编辑器类似ewebeditor
Linux终端下的快捷键技巧（终端linux快捷键）
【说站】python防止栈溢出的解决
MySQL解除外键约束：简单易行（mysql删除外键约束）
基于Broadwell平台的Meerkat Ubuntu Linux迷你PC
今天起，微软 Microsoft 365 服务不再支持 IE11 浏览器
Oracle开发实战：实现最佳效果（oracle开发实战）

相关主题

scrapy 教程
Python scrapy爬虫
python scrapy
scrapy爬虫框架
scrapy框架爬虫
爬虫框架scrapy
Scrapy框架
小刮刮Scrapy
Python之scrapy框架
python 爬虫 scrapy
Python爬虫之scrapy框架
Python安装scrapy库
Python 爬虫之Scrapy框架
65 爬虫 - Scrapy 框架
Python爬虫框架Scrapy
爬虫与反爬虫
Scrapy爬虫
Scrapy 框架介绍
python爬虫-scrapy

zl程序教程

当前栏目

scrapy怎么同时运行多个爬虫？

相关文章