解决在python 爬虫时爬取的网页中文乱码问题!
2023-09-27 14:20:16 时间
我们平常在爬虫过程中经常会遇到爬取的网页内容乱码的问题,我们知道肯定是编码的问题。一般情况下,网页编码都是UTF-8形式,但是有时候有一些例外,有可能会是GBK的编码方式。
解决中文乱码问题:
一. 查看网页编码
按F12,进入开发者模式,在最上面找到Console,输入document.charset,如图:
二. 在代码中设置编码方式为步骤一中的方式,例如:
res = requests.get(url)
res.encoding = 'gbk'
html = res.text
相关文章
- Python正则表达式 | 如何只提取中文、英文字母、数字(含科学计数法)
- Python图像处理丨图像的灰度线性变换
- 【python入门到精通】python中的枚举类
- python 打印Linux中文编码字符
- Python: 在CSV文件中写入中文字符
- 两种Python基于OpenCV的固定位置半透明水印去除方案
- python logging模块写入中文,文件乱码的解决方法
- Python 中,matplotlib绘图无法显示中文的问题
- python文件操作
- python教程简书_史上最全!Python入门教程完整版(懂中文就能学会)
- Python面试题之Python和Java中Super方法的区别
- 【python】获取网页中中文内容并分词
- 【Python】单行注释 || 多行注释 || 中文编码声明注释 || 以上博客知识汇总 || 变量&数据类型&类型转换&注释
- Python,OpenCV中的K近邻(knn K-Nearest Neighbor)及改进版的K近邻
- 成功解决:Can‘t find Python executable “python“, you can set the PYTHON env variable.
- PyQt(Python+Qt)学习随笔:使用实例方法赋值方式捕获事件
- Python中文文件处理中涉及的字符编码及字符集
- 关于Python中中文文本文件使用二进制方式读取后的解码UnicodeDecodeError问题
- Python Number(数字)
- Python 中文编码
- Python NumPy ufunc 小数四舍五入
- Python 多种中文乱码问题原因及解决方法(decode()、encode()、raw_input())
- Python XML 解析
- python opencv3 cornerHarris 角点检测
- Python 面向对象编程
- [Oracle] 用python插入中文
- python *args **kwargs
- python获取url响应
- Python_编程特色