您现在的位置是：首页 > 后端

当前栏目

Python爬虫：scrapy定时运行的脚本

Python 爬虫 scrapy 运行脚本定时

2023-09-14 09:07:14 时间

原理：

1个进程 -> 多个子进程 -> scrapy进程

代码示例

将以下代码文件放入scrapy项目中任意位置即可

# -*- coding: utf-8 -*-

# @File    : run_spider.py
# @Date    : 2018-08-06
# @Author  : Peng Shiyu

from multiprocessing import Process
from scrapy import cmdline
import time
import logging

# 配置参数即可, 爬虫名称，运行频率
confs = [
    {
        "spider_name": "hexun_pdf",
        "frequency": 2,
    },
]


def start_spider(spider_name, frequency):
    args = ["scrapy", "crawl", spider_name]
    while True:
        start = time.time()
        p = Process(target=cmdline.execute, args=(args,))
        p.start()
        p.join()
        logging.debug("### use time: %s" % (time.time() - start))
        time.sleep(frequency)


if __name__ == '__main__':
    for conf in confs:
        process = Process(target=start_spider,
                          args=(conf["spider_name"], conf["frequency"]))
        process.start()
        time.sleep(10)

猜你喜欢

问题-delphi在某电脑(win7)上是界面超乱 DPL
【Go进阶】详解方法的值类型和指针类型区别
第九届蓝桥杯JavaB组国(决)赛真题
MySQL常见面试题与答案
jQuery ajax 获取信息展示在“下拉列表”中
Mac安装brew包管理工具
c++ 怎样获取系统时间
技术实践丨如何解决异步接口请求快慢不均导致的数据错误问题？
spring boot与spring mvc的区别是什么？
CSS Transform让百分比宽高布局元素水平垂直居中
JavaME中可用的StringTokenizer
Python每日一练——第5天：闰年问题升级版
SpringCloud 组件熔断器Hystrix

相关主题

python 中的变量
python glob 模块
h5 Python_python做h5网站
Python爬虫之scrapy框架
Python---爬虫
Python爬虫一

zl程序教程

当前栏目

Python爬虫：scrapy定时运行的脚本

代码示例

相关文章