Python 处理Excel总结
2023-06-13 09:14:21 时间
点击上方'伦少的博客'关注与您一起成长
前言
学习总结Python处理Excel
文件
一个测试有两个sheet页的Excel测试文件 https://github.com/dongkelun/python/blob/master/data/test.xlsx
代码
完整代码已上传到GitHub https://github.com/dongkelun/python/blob/master/excel/sheetDemo.py
import pandas as pd
file1 = pd.ExcelFile('D:\\data\\py\\test.xlsx')
file2 = pd.read_excel('D:\\data\\py\\test.xlsx')
print(file)
<pandas.io.excel._base.ExcelFile object at 0x0000021DE525DF88>
-----------------分割线---------------------
姓名 年龄 性别 住址
0 张三 7 男 NaN
1 李四 6 男 NaN
2 王芳 6 女 NaN
分析
pd.read_excel读出来是一个dataframe可以直接打印出内容,但是只能读取一个sheet页,默认第一个sheet页
@Appender(_read_excel_doc)
@deprecate_kwarg("skip_footer", "skipfooter")
def read_excel(
io,
sheet_name=0,
header=0,
names=None,
index_col=None,
usecols=None,
squeeze=False,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None,
nrows=None,
na_values=None,
keep_default_na=True,
verbose=False,
parse_dates=False,
date_parser=None,
thousands=None,
comment=None,
skip_footer=0,
skipfooter=0,
convert_float=True,
mangle_dupe_cols=True,
**kwds
):
for arg in ("sheet", "sheetname", "parse_cols"):
if arg in kwds:
raise TypeError(
"read_excel() got an unexpected keyword argument " "`{}`".format(arg)
)
if not isinstance(io, ExcelFile):
io = ExcelFile(io, engine=engine)
elif engine and engine != io.engine:
raise ValueError(
"Engine should not be specified when passing "
"an ExcelFile - ExcelFile already has the engine set"
)
return io.parse(
sheet_name=sheet_name,
header=header,
names=names,
index_col=index_col,
usecols=usecols,
squeeze=squeeze,
dtype=dtype,
converters=converters,
true_values=true_values,
false_values=false_values,
skiprows=skiprows,
nrows=nrows,
na_values=na_values,
keep_default_na=keep_default_na,
verbose=verbose,
parse_dates=parse_dates,
date_parser=date_parser,
thousands=thousands,
comment=comment,
skipfooter=skipfooter,
convert_float=convert_float,
mangle_dupe_cols=mangle_dupe_cols,
**kwds
)
pd.ExcelFile 返回值是一个Excel对象,不能直接用,但是可以读取整个Excel内容
pd.ExcelFile
file = pd.ExcelFile('D:\\data\\py\\test.xlsx')
sheet页名称
print(file.sheet_names)
['一年级', '二年级']
遍历读取每个sheet页的内容
for name in file.sheet_names:
_df = pd.read_excel(file,name)
print(_df)
姓名 年龄 性别 住址
0 张三 7 男 NaN
1 李四 6 男 NaN
2 王芳 6 女 NaN
姓名 年龄 性别
0 李明 8 男
1 刘敏 8 女
2 张强 7 男
将两个sheet页的内容合并,并添加一列内容为sheet页名称
df_list=[]
for name in file.sheet_names:
_df = pd.read_excel(file,name)
_df['班级']=name
df_list.append(_df)
df = pd.concat([_df for _df in df_list],sort=False)
print(df)
姓名 年龄 性别 住址 班级
0 张三 7 男 NaN 一年级
1 李四 6 男 NaN 一年级
2 王芳 6 女 NaN 一年级
0 李明 8 男 NaN 二年级
1 刘敏 8 女 NaN 二年级
2 张强 7 男 NaN 二年级
忽略掉原来的index
df = pd.concat([_df for _df in df_list],ignore_index=True,sort=False)
print(df)
姓名 年龄 性别 住址 班级
0 张三 7 男 NaN 一年级
1 李四 6 男 NaN 一年级
2 王芳 6 女 NaN 一年级
3 李明 8 男 NaN 二年级
4 刘敏 8 女 NaN 二年级
5 张强 7 男 NaN 二年级
修改列名为英文
df = df.rename(columns={'姓名': 'name', '年龄': 'age', '性别': 'sex', '住址': 'address', '班级': 'class'})
print(df)
name age sex address class
0 张三 7 男 NaN 一年级
1 李四 6 男 NaN 一年级
2 王芳 6 女 NaN 一年级
3 李明 8 男 NaN 二年级
4 刘敏 8 女 NaN 二年级
5 张强 7 男 NaN 二年级
将df保存为CSV、Excel文件
sheet合并.csv sheet合并.xls
df.to_csv('../data/sheet合并.csv',index=False)
df.to_excel('../data/sheet合并.xls',index=True)
总结
可以发现Python读写Excel文件还是很方便的!
相关文章
- pycharm安装pyqt5-tools_python pyqt5教程
- 浙江新增python编程_9月起,浙江省八年级新增Python编程课,未来编程是处理大数据的手段…「建议收藏」
- python人工智能学习笔记_[Python] 人工智能与自然语言处理学习笔记(1)[通俗易懂]
- python中替换字符串中字符_Python replace()函数:替换字符串中的某个字符「建议收藏」
- Python中的输出「建议收藏」
- 符合python命名规范的标识符是什么_Python标识符命名规范
- Python处理Excel数据-pandas篇
- pycharm快捷运行_pycharm打开python项目
- python做微信回复机器人_Python自动化脚本
- python如何生成随机数_Python生成50个随机数
- 【视频】Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析|数据分享|附代码数据
- python入门之后须掌握的知识点(excel文件处理+邮件发送+实战:批量化发工资条)【二】
- python-Python与SQLite数据库-处理SQLite查询结果(一)
- python-Python与SQLite数据库-处理SQLite查询结果(二)
- ElasticSearch 数据导入导出Python工具详解编程语言
- Linux 启动 Python编程之旅(linux打开python)
- 轻松实现Excel导入MySQL数据库(excel导入mysql数据库)
- 快速安装Excel:Linux用户指南(linux安装excel)
- 使用 Python 学习面向对象的编程