您现在的位置是：首页 > Python

当前栏目

Python爬虫编程思想（146）：创建和使用Scrapy工程

Python 文件编程

2023-04-18 14:46:16 时间

Scrapy框架提供了一个scrapy命令用来建立Scrapy工程，可以使用下面的命令建立一个名为myscrapy是Scrapy工程。

scrapy startproject myscrapy

执行上面的命令后，会在当前目录下创建一个myscrapy子目录。在myscrapy目录中还有一个myscrapy子目录，在该目录中有一堆子目录和文件，这些目录和文件就对应了图19-1所示的各部分。例如，spiders目录就对应了网络爬虫，其他的目录和文件先不用管。因为使用Scrapy框架编写网络爬虫的主要工作就是编写Spider。所有的Spider脚本文件都要放到spiders目录中。

下面的例子会在spiders目录中建立一个firstSpider.py脚本文件，这是一个Spider程序，在该程序中会指定要抓取的Web资源的Url。

import scrapy class Test1Spider(scrapy.Spider): # Spider的名称，需要该名称启动Scrapy name = ‘FirstSpider’ # 指定要抓取的Web资源的Url start_urls = [ ‘京

猜你喜欢

class字节码文件结构
useDark的使用方法以及Element-Plus深色主题切换案例（vue3）
每日算法之翻转单词序列
若依框架文档开发手册----开发中常用功能模块
面向对象编程三大特性------封装、继承、多态(概念理解，应用举例)
vue项目中常用解决跨域的方法
在vue3项目中使用新版高德地图
JVM指令手册
几行代码，就写完懒加载啦？
Redis 常见问题
JS垃圾回收机制
第2-3-6章打包批量下载附件的接口开发-文件存储服务系统-nginx/fastDFS/minio/阿里云oss/七牛云oss
day18-web工程路径
【jQuery从入门到精通】
前端vue+element使用SM4国密加密解密
npm安装报错（npm ERR! code EPERM npm ERR! syscall mkdir npm ERR! path C:\Program Files\nodejs\node_ca...）
如何使用wireshark抓取HTTPS数据包？
框架进行时——SpringMVC流程简析（一）
【博主推荐】html好看的个人主页(附源码)
创建第一个springmvc程序

zl程序教程

当前栏目

Python爬虫编程思想（146）：创建和使用Scrapy工程

相关文章