您现在的位置是：首页 > 后端

当前栏目

Python编程：Python2.7环境下的中文文件读写

Python 中文文件 python2.7 编程环境读写

2023-09-14 09:07:15 时间

测试过程比较啰嗦，可以直接看文章底部的结论

测试环境
python 2.7.5

读写的文本

# -*- coding: utf-8 -*-

poetry = """
相思
唐代：王维
红豆生南国，春来发几枝。
愿君多采撷，此物最相思。
"""

1、直接读写中文（正常）

# -*- coding: utf-8 -*-

# 写入（正常）
f = open("相思.txt", "w")
f.write(poetry)
f.close()

# 读取（正常）
f = open("相思.txt", "r")
print(f.read())
f.close()

2、引入future 后读写中文（报错）

# -*- coding: utf-8 -*-

from __future__ import unicode_literals, print_function

# 写入（报错）
f = open("相思.txt", "w")
f.write(poetry)
f.close()

"""
Traceback (most recent call last):
  File "code_demo.py", line 18, in <module>
    f.write(poetry)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-2: 
ordinal not in range(128)
"""

# 读取（正常）
f = open("相思.txt", "r")
print(f.read())
f.close()

3、引入future 后通过io读写中文（正常）

# -*- coding: utf-8 -*-

from __future__ import unicode_literals, print_function
import io

# 写入（正常）
f = io.open("相思.txt", "w")
f.write(poetry)
f.close()

# 读取(正常)
f = io.open("相思.txt", "r")
print(f.read())
f.close()

4、使用codecs直接读写中文（正常）

# -*- coding: utf-8 -*-

import codecs

# 写入(正常) 
f = codecs.open("相思.txt", "w")
f.write(poetry)
f.close()

# 读取(正常)
f = codecs.open("相思.txt", "r")
print(f.read())
f.close()

5、引入future 后使用codecs读写中文(报错)

# -*- coding: utf-8 -*-

from __future__ import unicode_literals, print_function
import codecs

# 写入(报错) 
f = codecs.open("相思.txt", "w")
f.write(poetry)
f.close()
"""
Traceback (most recent call last):
  File "code_demo.py", line 19, in <module>
    f.write(poetry)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 1-2: 
ordinal not in range(128)
"""

# 读取(正常)
f = codecs.open("相思.txt", "r")
print(f.read())
f.close()

6、引入future 后使用codecs指定编码后读写中文(正常)

# -*- coding: utf-8 -*-

from __future__ import unicode_literals, print_function
import codecs


# 写入(正常)  需要制定编码  "utf-8"
f = codecs.open("相思.txt", "w", "utf-8")
f.write(poetry)
f.close()

# 读取(正常)
f = codecs.open("相思.txt", "r")
print(f.read())
f.close()

总结

环境	编码	读写方式	读情况	写情况
默认	ASCII	open	-	-
引入`future`	unicode	open	-	报错
引入`future`	unicode	io.open	-	-
默认	ASCII	codecs.open	-	-
引入`future`	unicode	codecs.open	-	报错
引入`future`	unicode	codecs.open指定编码`utf-8`	-	-

所以，默认编码是ASCII码，正常情况下直接读写是没有问题的，如果引入新特性future.unicode_literals之后，文件的中文编码变成了unicode，原来的不支持unicode读写的方式就会报错

在Python2.7 中，内建的 open函数是没有encoding参数的，不能指定编码，只能通过io.open 来读写unicode编码的中文，或者通过codecs.open 指定编码方式

在Python3之后，内建的 open函数添加了encoding参数，可以直接指定编码，当然Python3的默认编码已经改为了unicode，没有那么多问题

猜你喜欢

hadoop mapreduce经常OOM详解大数据
解析将多维数组转换为支持curl提交的一维数组格式
【JDBC】使用连接池重写工具类
roc曲线的意义_【科研助手】ROC曲线在医学诊断类稿件中的应用「建议收藏」
技术文档 | OpenSCA技术原理之composer依赖解析
英特尔或将在德国建芯片工厂正与巴伐利亚州洽谈
POI设置EXCEL单元格格式为文本、小数、百分比、货币、日期、科学计数法和中文大写详解编程语言
python读取图像的几种方法_python图像识别教程
MySQL数据库排序技术的探索（mysqlsql排序）
php取整函数ceil,floo,round的用法及介绍
极速推荐最佳redis客户端解决方案（推荐redis客户端）
Linux R：实现Linux系统中的数据分析与可视化（linuxr）
IIS绑定域名图解教程
传智播客：精通Redis视频教程（传智播客redis视频）
如何使用Oracle命令启动服务（oracle命令启动服务）

相关主题

Python中的@符号
python ipython 包
Python协程-gevent
h5 Python_python做h5网站
05-Python函数
python pip 升级

zl程序教程

当前栏目

Python编程：Python2.7环境下的中文文件读写

总结

相关文章