zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python爬虫自学系列(四)

Python爬虫 系列 自学
2023-09-14 09:15:25 时间

在这里插入图片描述

前言

上一篇讲的是爬虫中的缓存,相对来说比较难一点,而且不是直接面向网页的,所以可能会比较无聊一点吧。

这一篇我们来讲当遇到动态网页时候的另一种处理办法,即json抓包处理。

然后呢,再讲一下界面交互相关的事情。

为什么能讲这么多呢?因为之前都讲好了,现在总结一下再深化一点啦。


关于动态网页的json包

和单页面应用的简单表单事件不同,使用 JavaScript 时,不再是加载后立即下载页面全部内容。这种架构会造成许多网页在浏览器中展示的内容可能不会出现在 HTML 源代码中,我们在前面介绍的抓取技术也就无法抽取网站的重要信息了。

这篇带上了几个例子讲解了为什么要用json,以及该如何抓包的问题,喜欢的人还不少: