DataFrame(11):数据转换——map()函数的使用
2023-03-20 14:40:17 时间
1、map()函数
1)map()函数作用
将序列中的每一个元素,输入函数,最后将映射后的每个值返回合并,得到一个迭代器。
2)map()函数原理图
原理解释: 上图有一个列表,元素分别是从1-9。map()函数的作用就是,依次从这个列表中取出每一个元素,然后放到f(x)函数中,最终得到一个通过函数映射后的结果。
3)map()内置函数和Series的map()方法
① map作为python内置函数的用法
说明:依次取出序列(iterable)中的每一个元素,放到函数(function)中,最终得到一个迭代器,我们可以使用list或者for循环得到其中的元素。
② Series的map()方法
说明:依次取出序列(Series)中的每一个元素,放到函数(function)中,最终得到一个Series结果。
2、map()函数实例
1)原始数据文件链接如下
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx")
display(df)
结果如下:
① 将姓名转换为首字母大写,其余字母小写
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx")
display(df)
df["name"] = df["name"].map(str.capitalize)
display(df)
结果如下:
② 提取日期中的年、月、日
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx")
display(df)
# 注意:这里的日期列,是时间格式
df["year"] = df["日期"].map(lambda x:x.year)
df["month"] = df["日期"].map(lambda x:x.month)
df["day"] = df["日期"].map(lambda x:x.day)
display(df)
结果如下:
③ 求每个人的销售额:销售量*单价
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx")
display(df)
df["销售额"] = list(map(lambda x,y:x*y,df["销售量"],df["单价"]))
display(df)
结果如下:
④ 合并两列
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx",sheet_name=1)
display(df)
df["姓名"] = list(map(lambda x,y:x+"_"+y,df["姓"],df["名"]))
display(df)
结果如下:
⑤ 将电话号码中间4-8位替换为*
df = pd.read_excel(r"C:Users黄伟Desktop est1.xlsx",sheet_name=1)
display(df)
df["隐藏真实电话"] = df["电话号码"].astype("str").map(lambda x:x.replace(x[3:8],"*****"))
display(df)
结果如下:
相关文章
- 从本体论开始说起——运营商关系图谱的构建及应用
- 如何成为一名数据科学家?
- 从未见过的堂兄杀了人,你的DNA是关键证据
- 20个安全可靠的免费数据源,各领域数据任你挑
- 20个安全可靠的免费数据源,各领域数据任你挑
- 阿里云李飞飞:All in Cloud时代,云原生数据库优势明显
- 基于Hadoop生态系统的一高性能数据存储格式CarbonData(性能篇)
- 大数据告诉你:10年漫威,到底有多少角色
- TigerGraph:实时图数据库助力金融风控升级
- Splunk利用Splunk Connected Experiences和Splunk Business Flow 扩大数据访问
- 大数据开发常见的9种数据分析手段
- 以免在景区看人,我爬了5W条全国景点门票数据...
- 【实战解析】基于HBase的大数据存储在京东的应用场景
- 数据科学家告诉你哪些计算机科学书籍是你应该看的
- Kafka作为大数据的核心技术,你了解多少?
- Spring Boot 整合 Redis 实现缓存操作
- 大数据学习必须掌握的五大核心技术有哪些?
- 基于Antlr在Apache Flink中实现监控规则DSL化的探索实践
- 甲骨文再次被Gartner评为分析型数据管理解决方案魔力象限领导者
- 爬取吴亦凡微博102118条转发数据,扒一扒流量的真假