python DataFrame的stack()方法,unstack()方法,pivot()方法
2023-09-11 14:14:25 时间
![在这里插入图片描述](https://img-blog.csdnimg.cn/2249bac63e3f42c0a1947fa0e3864dbd.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5L6v5bCP5ZW-,size_20,color_FFFFFF,t_70,g_se,x_16)
1.stack()
stack()用于将列索引转换为最内层的行索引,这样叙述比较抽象,看示例就容易理解啦:
准备一组数据,给其设置双索引。
import pandas as pd
data = [['A类', 'a1', 123, 224, 254], ['A类', 'a2', 234, 135, 444], ['A类', 'a3', 345, 241, 324],
['B类', 'b1', 112, 412, 466], ['B类', 'b2', 224, 235, 345], ['B类', 'b3', 369, 214, 352],
['C类', 'c1', 236, 251, 485], ['C类', 'c2', 378, 216, 515], ['C类', 'c3', 135, 421, 312],
['D类', 'd1', 306, 325, 496], ['D类', 'd2', 147, 235, 524], ['D类', 'd3', 520, 222, 267]]
df = pd.DataFrame(data=data, columns=['类别', '编号', 'A指标', 'B指标', 'C指标'])
df = df.set_index(['类别', '编号'])
print(df)
df = df.stack()
print(df)
如图,成功将索引列之外的 A指标,B指标,C指标三列放在了同一列。
此时的df,不再是一个DataFrame,而变为了一个Series对象。:
print(type(df))
该Series的index列不同于原DataFrame的index列,而是在原DataFrame的index列的基础上,又增加了从右边合并过来的部分:
print(df.index)
此时Values为:
print(df.values)
2. unstack()
unstack是stack的逆向操作。
在上述示例的代码的基础上,对上边的df继续调用unstack()方法:
df1 = df.unstack()
print(df1)
可以看到unstack变回了原来的样子。
3. pivot()
这里对于上边例子中的数据稍作调整:
不设置多重索引
import pandas as pd
data = [['A类', '1', 123, 224, 254], ['A类', '2', 234, 135, 444], ['A类', '3', 345, 241, 324],
['B类', '1', 112, 412, 466], ['B类', '2', 224, 235, 345], ['B类', '3', 369, 214, 352],
['C类', '1', 236, 251, 485], ['C类', '2', 378, 216, 515], ['C类', '3', 135, 421, 312],
['D类', '1', 306, 325, 496], ['D类', '2', 147, 235, 524], ['D类', '3', 520, 222, 267]]
df = pd.DataFrame(data=data, columns=['类别', '编号', 'A指标', 'B指标', 'C指标'])
print(df)
df2 = df.pivot(index='编号', columns='类别', values='A指标')
print(df2)
index和columns分别指设定那一列的值为index,设置那一列的值为columns。values指表格要体现的指标。
df3 = df.pivot(index='类别', columns='编号', values='A指标')
print(df3)
相关文章
- Python 执行 shell命令 的几个方法小结
- python爬虫知识点总结(六)BeautifulSoup库详解
- Word处理控件Aspose.Words功能演示:在 Python 中将 PDF 转换为 JPG
- Notepad++ 设置执行 lua 和 python
- Python 计算之除法
- 机器学习笔记之密度聚类——DBSCAN方法(Python代码实现)
- Python安装模块出错(No module named setuptools)解决方法
- Python使用集合将txt文件重复行去除
- python版本升级及pip部署方法
- 《像计算机科学家一样思考Python(第2版)》——2.6 字符串操作
- 《像计算机科学家一样思考Python》——第3章 函数 3.1 函数调用
- 《Python机器学习——预测分析核心算法》——小结
- python 子类中定义init方法
- 《Python编程实战:运用设计模式、并发和程序库创建高质量程序》—— 1.3 工厂方法模式
- 在Python中,什么是NumPy?如何使用?
- Python测试前置操作的方法
- python中time.strftime不支持中文,报错UnicodeEncodeError: 'locale' codec can't encode character 'u5e74' in position 2: encoding error
- python中不同方法的按索引读取数组的性能比较——哪种按索引读取数组的性能更好
- Python——在for循环中更改list值的方法
- 《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.7 停用词移除
- 2022&2023华为OD机试 - 磁盘容量(Python)
- python常用时间处理方法
- Python 数字数据类型
- 【图像处理】——图像滤波(Python+opencv实现三种方法:均值滤波、中值滤波、高斯滤波等)
- AES SBox的构造(python)
- [Python] join()方法