您现在的位置是：首页 > 后端

当前栏目

Scrapy返回空列表问题的解决办法

列表 scrapy 解决办法返回问题

2023-09-11 14:19:30 时间

今天学习Scrapy框架时，调用下面的方法发送请求时返回的居然是一个空列表。

import scrapy


class Test01Spider(scrapy.Spider):
    name = "test01"
    allowed_domains = ["https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6/6699?fromModule=lemma_search-box"]
    start_urls = ["https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6/6699?fromModule=lemma_search-box"]


    def parse(self, response):
        pass
        get_text = response.xpath("/html/body/div[3]/div[2]/div/div[1]/div[4]/div[3]/text()").extract()
        print(get_text)

在我尝试很多遍，并且检查发现xpath没错的情况下还是返回空列表。

后面上网搜了很多解决方案，发现是头信息里的cookie没有设置，Scrapy默认用了它内部设置的头信息。于是对setting里面的内容进行修改就可以了：

1、取消注释COOKIES_ENABLE = False：

2、取消注释DEFAULT_REQUEST_HEADERS并且增加Cookie信息：

这样再请求就可以获取到相应的信息了：

猜你喜欢

IT桔子沙龙之本地生活服务O2O探路者笔记整理
python五十八课——正则表达式（替换）
基于PCM2912a的USB声卡设计
135Echarts - 路径图（Use lines to draw 1 million ny streets.）
[LintCode] Mini Twitter 迷你推特
Python单例模式(Singleton)的N种实现
5月11日云栖精选夜读：在阿里云ECS上轻松实现无域控的SQL Server AlwaysOn可用性组
Django实现adminx更新表单自动同步到其他模型
医疗健康大数据服务平台技术架构
在Linux终端中生成随机强密码的5种方法
Allegro导入导出设计数据操作指导
Java对象创建、分配、布局、访问小析(HotSpot虚拟机)(三)
mvn命令若干：
算法基础：删除字符串中出现次数最少的字符（Golang实现）
Google Earth Engine（GEE）——累积成本映射（土地覆盖图像中的最低成本路径）
思维即结构--思维导图的本质是结构化思维
【接口测试】Day1-接口测试基础（附项目实战）
[nodejs]er_bad_field_error NaN in where clause
该不该选择Python 作为第一编程语言
【漏洞通告】Citrix 多个高危漏洞通告
一个21行C#代码实现的神经网络

相关主题

列表推导
9散列表
XML做下拉列表
Bootstrap列表组
python 6 列表

zl程序教程

当前栏目

Scrapy返回空列表问题的解决办法

相关文章