看我如何用定值 Cookie 实现反爬
摘要:本次案例,用定值Cookie实现反爬。
本文分享自华为云社区《我是怎么用一个特殊Cookie,限制住别人的爬虫的》,作者: 梦想橡皮擦 。
Cookie 生成
由于本案例需要用到一个特定的 Cookie ,所以我们需要提前将其生成,你可以直接设置一个固定的字符串,也可以使用 Python 加密模块来加密一段文本,例如本案例加密 梦想橡皮擦。
下面是一个示例代码,展示了如何使用 Python 的 hashlib 模块进行加密:
import hashlib # 要加密的文本 text = "梦想橡皮擦" # 使用 sha256 算法进行加密 encrypted_text = hashlib.sha256(text.encode()).hexdigest() print(encrypted_text)
在这个例子中,我们使用了 hashlib 模块中的 sha256 算法对文本进行加密。这个算法生成了一个长度为 64 位的十六进制哈希值,用于表示加密后的文本。
注意,这个算法只能用于加密文本,而不能用于解密。因此,一旦文本被加密,就无法恢复成原来的文本,即不可逆加密/单项加密。
Python Flask 框架生成 Cookie
在 Python 的 Flask 框架中,可以使用 make_response 函数和 set_cookie 方法来生成一个 Cookie。
例如,下面的代码片段展示了如何在 Flask 中设置一个名为 story 的 Cookie,并将它的值设为前文建立的加密串。
from flask import Flask, make_response app = Flask(__name__) @app.route('/') def index(): resp = make_response('Setting a cookie') encrypted_text = hashlib.sha256(text.encode()).hexdigest() resp.set_cookie('story', encrypted_text) return resp
在这个例子中,我们使用 make_response() 函数创建了一个响应对象,然后使用 set_cookie() 方法来设置 cookie。最后,我们将响应对象返回给客户端。
注意,上面的代码仅创建了一个简单的 Cookie,它只有名称和值两个部分。你还可以使用其他可选参数来设置 Cookie 的其他属性,例如过期时间、域名等。
接下来为大家在补充一下 make_response() 相关知识。
Flask make_response 加载模板
在 Flask 中,你可以使用 make_response() 函数和模板系统来生成带有模板的响应。
下面是一个示例代码,展示了如何使用 make_response() 函数加载模板:
from flask import Flask, make_response, render_template app = Flask(__name__) @app.route('/') def index(): # 加载模板并渲染 rendered_template = render_template('index.html', title='梦想橡皮擦') # 使用 make_response 函数创建响应 resp = make_response(rendered_template) return resp
在这个例子中,我们首先使用 Flask 的 render_template() 函数加载并渲染了名为 index.html 的模板。然后我们使用 make_response() 函数创建了一个响应对象,并将渲染后的模板作为响应的内容。最后,我们返回了这个响应对象给客户端。
注意,你需要在 Flask 应用的模板目录中存在名为 index.html 的模板文件,才能正常使用上述代码。
然后我们将该视图函数补充完整,代码在 app/routes.py 文件中。
@app.route('/') @app.route('/index') def index(): item = { "msg": "后台传递信息" } # 访问首页生成一个 Cookie 值,该值用于访问特定页面 rendered_template = render_template('index.html', title='梦想橡皮擦') resp = make_response(rendered_template) text = "梦想橡皮擦" # 使用 sha256 算法进行加密 encrypted_text = hashlib.sha256(text.encode()).hexdigest() resp.set_cookie('story', encrypted_text) return resp
此时当我们访问爬虫训练场首页的时候,就会在 Cookie 中写入一个加密之后的字符串。
通过开发者工具,可以查看到响应头。
![](https://pic1.zhimg.com/80/v2-8a6706180228adfe5d6d49d867528664_720w.webp)
最后一步,就是在 Python Flask 框架中判断刚刚的 Cookie 值,如果存在则响应数据,否则返回 403。
Flask 判断指定 cookie 是否存在
在 Python 的 Flask 框架中,你可以使用 request.cookies 属性来判断指定的 Cookie 是否存在。
例如,下面的代码片段展示了如何判断一个名为 story 的 Cookie 是否存在:
from flask import Flask, request app = Flask(__name__) @app.route('/') def index(): if 'story' in request.cookies: # 如果存在 'story' cookie,则执行相应操作 # ... else: # 如果不存在 'story' cookie,则执行相应操作 # ...
将代码补充完整,文件是 app/antispider/index.py。
@antispider.route('/cookie_demo') def cookie_demo(): if 'story' in request.cookies: # 如果存在 'story' cookie,则执行相应操作 # ... return render_template("antispider/cookie_demo.html") else: return "没有权限", 403
补充知识点
在 Python 的 Flask 框架中,除了使用 set_cookie() 方法设置 cookie 以外,还有其他几种操作 cookie 的方法。
下面是一些常用的操作 cookie 的方法:
- 设置 cookie 的值:你可以使用 set_cookie() 方法来设置 cookie 的值。例如:
from flask import Flask, make_response app = Flask(__name__) @app.route('/') def index(): resp = make_response('Setting a cookie') resp.set_cookie('user', 'xiangpica') return resp
- 获取 cookie 的值:你可以使用 request.cookies字典来获取 cookie 的值。例如:
from flask import Flask, request app = Flask(__name__) @app.route('/') def index(): user = request.cookies.get('user') return user
- 删除 cookie:你可以使用 set_cookie() 方法并将 cookie 的过期时间设为过去的时间来删除 cookie。例如:
from flask import Flask, make_response app = Flask(__name__) @app.route('/') def index(): resp = make_response('Deleting a cookie') resp.set_cookie('user', '', expires=0) return resp
相关文章
- Express使用进阶:cookie-parser中间件实现深入剖析
- ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面,各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议 用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目
- Cookie和Session
- 请你谈谈Cookie的弊端
- koa 基础(十四)cookie 的基本使用
- session,cookie,token区别
- urllib库利用cookie实现模拟登录慕课网
- 使用JavaScript实现cookie的设置、读取、删除
- 一、Core授权(基于cookie)
- 谷歌浏览器如何检查cookie存放位置
- Servlet 2.5为cookie配置HTTPOnly属性
- js实现cookie跨域功能
- 浅析从axios HTTP 拦截器的设计与实现里学习如何设计通用的任务处理模型(任务注册/任务编排/任务调度)、axios HTTP 适配器的设计与实现、常见CSRF防御措施(检查Referer、同步表单CSRF Token校验、双重Cookie防御)、axios 自带 CSRF 防御的实现原理
- 神奇神奇神奇!灵异灵异灵异!IE firefox cookie 生存状态
- 登陆用户怎样获取验证码和保存用户到cookie中
- C# 使用HttpWebRequest Post提交数据,携带Cookie和相关参数示例