对比excel,学习pandas数据透视表
2023-03-20 14:40:23 时间
1、excel中做数据透视表
1)步骤如下
① 选中整个数据源;
② 依次点击“插入”—“数据透视表”
③ 选择在Excel中的哪个位置,插入数据透视表
④ 然后根据实际需求,从不同维度展示结果
⑤ 结果如下
2、pandas中使用pivot_table()做数据透视表
1)语法格式
pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc='mean',
margins=False,margins_name='All',
dropna=True,fill_value=None)
2)对比excel,说明上述参数的具体含义
参数说明:
- data 相当于Excel中的"选中数据源";
- index 相当于上述"数据透视表字段"中的行;
- columns 相当于上述"数据透视表字段"中的列;
- values 相当于上述"数据透视表字段"中的值;
- aggfunc 相当于上述"结果"中的计算类型;
- margins 相当于上述"结果"中的总计;
- margins_name 相当于修改"总计"名,为其它名称;
下面几个参数,用的较少,记住干嘛的,等以后需要就百度。
- dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;
- fill_value 表示将缺失值,用某个指定值填充。
3、案例说明
1)求出不同品牌下,每个月份的销售数量之和
① 在Excel中的操作结果如下
② 在pandas中的操作如下
df = pd.read_excel(r"C:Users黄伟Desktoppivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)
结果如下:
2)求出不同品牌下,每个地区、每个月份的销售数量之和
① 在Excel中的操作结果如下
② 在pandas中的操作如下
df = pd.read_excel(r"C:Users黄伟Desktoppivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],
values="销售数量",aggfunc=np.sum)
display(df1)
结果如下:
3)求出不同品牌不同地区下,每个月份的销售数量之和
① 在Excel中的操作结果如下
② 在pandas中的操作如下
df = pd.read_excel(r"C:Users黄伟Desktoppivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)
结果如下:
4)求出不同品牌下的“销售数量之和”与“货号计数”
① 在Excel中的操作结果如下
② 在pandas中的操作如下
df = pd.read_excel(r"C:Users黄伟Desktoppivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns="月份",
values=["销售数量","货号"],
aggfunc={"销售数量":"sum","货号":"count"},
margins=True,margins_name="总计")
display(df1)
结果如下:
相关文章
- 金融服务领域的大数据:即时分析
- 影响大数据、机器学习和人工智能未来发展的8个因素
- 从0开始构建一个属于你自己的PHP框架
- 如何将Hadoop集成到工作流程中?这6个优秀实践必看
- SEO公司使用大数据优化其模型的5种方法
- 关于Web Workers你需要了解的七件事
- 深入理解HTTPS原理、过程与实践
- 增强分析:数据和分析的未来
- PHP协程实现过程详解
- AI专家:大数据知识图谱——实战经验总结
- 关于PHP的错误机制总结
- 利用数据分析量化协同过滤算法的两大常见难题
- 怎么做大数据工作流调度系统?大厂架构师一语点破!
- 2019大数据处理必备的十大工具,从Linux到架构师必修
- OpenCV中的KMeans算法介绍与应用
- 教大家如果搭建一套phpstorm+wamp+xdebug调试PHP的环境
- CentOS下三种PHP拓展安装方法
- Go语言HTTP Server源码分析
- Go语言HTTP Server源码分析
- 2017年4月编程语言排行榜:Hack首次进入前五十