您现在的位置是：首页 > 后端

当前栏目

解决在python 爬虫时爬取的网页中文乱码问题！

Python 中文网页爬虫解决乱码问题

2023-09-27 14:20:16 时间

我们平常在爬虫过程中经常会遇到爬取的网页内容乱码的问题，我们知道肯定是编码的问题。一般情况下，网页编码都是UTF-8形式，但是有时候有一些例外，有可能会是GBK的编码方式。
解决中文乱码问题：
一. 查看网页编码
按F12，进入开发者模式，在最上面找到Console，输入document.charset，如图：
在这里插入图片描述
二. 在代码中设置编码方式为步骤一中的方式，例如：

res = requests.get(url)
res.encoding = 'gbk'
html = res.text

猜你喜欢

数字时代反思竞争理论
看看有哪些 Web 攻击技术.
centos7上安装0penStack
第24天：Python 标准库概览2
云端灾难恢复的主要注意事项
python爬虫之selenium--加载浏览器配置
添加收藏设置首页
AlterNET Studio2022Crack,alternet模式
强哥说Java--Java继承
09事件传递参数-封装网络请求api get和post合并整合在一起
Tapestry5.3使用总结
自己日常的maven搭建技巧
Spring boot admin 服务监控利器
NYOJ 118 路方案(第二小的跨越)
混合云平台为何更适合现代应用开发

相关主题

Python 中文编码
python 字典操作
Python语法详解
Python 中文乱码
Python自动化运维1
Python的datetime

zl程序教程

当前栏目

解决在python 爬虫时爬取的网页中文乱码问题！

相关文章