zl程序教程

您现在的位置是:首页 >  后端

当前栏目

爬虫日记(90):Scrapy的HTTP11DownloadHandler类

爬虫scrapy 日记 90
2023-09-14 09:10:04 时间

在爬虫里,使用最多的下载机制,还是HTTP协议,因此这个协议的实现就非常关键了,也是一个比较复杂的实现,要读懂这个类要比较费时间和精力。虽然比较复杂,我们还是一步一步地去分析这些代码实现,以便我们可以自己实现HTTP协议,或者修改HTTP协议,又或者整个这部分源码自己的工程。

在scrapy引入这个类,并不是直接以这个类的名称,而是改为别名HTTPDownloadHandler,如下所示:

 因此下载HTTP/HTTPS协议的时候,就是调用HTTP11DownloadHandler类。

接着下来,我们就来先看看这个类的构造函数: