DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)
2023-03-20 14:40:15 时间
1、DataFrame逻辑运算
- 逻辑运算符号:> >= < <= == !=
- 复合逻辑运算符:& | ~
- 逻辑运算函数:query()、isin()、between()
- 逻辑运算的作用:利用逻辑运算,用于筛选数据(很重要)
2、原始数据文件链接如下
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
结果如下:
3、逻辑运算符的案例说明
1)筛选出“数学成绩大于等于60并且英语成绩大于等于70”的记录
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
x = (df["数学"]>=60) & (df["英语"]>=70)
display(x)
df1 = df[(df["数学"]>=60) & (df["英语"]>=70)]
display(df1)
结果如下:
2)筛选出“语文成绩小于60或者数学成绩大于80”的记录
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
x = (df["语文"]<60) | (df["数学"]>80)
display(x)
df1 = df[(df["语文"]<60) | (df["数学"]>80)]
display(df1)
结果如下:
3)筛选出“语文成绩里面的非空记录”的记录(这种方式很重要)
# 自己在原始数据中,任意删除三个值,重新读取即可
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
x = df["语文"].isnull()
display(x)
y = ~df["语文"].isnull()
display(y)
df1 = df[~df["语文"].isnull()]
display(df1)
结果如下:
注意:isnull()判断某个值是否为空,如果是返回True,否则返回False。
4、逻辑运算函数:query()、isin()、between()
1)query()函数:能够简化查询代码,很好用
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
df1 = df.query("语文>=60")
df1
df1 = df.query("语文>=60 & 数学>=60")
df1
结果如下:
2)isin()函数:查看df中是否某含某个值或者某些值
① isin()函数说明
使用isin()函数,不仅可以针对整个df操作,也可以针对df中的某一列(Series)操作,但是针对Series的操作才是最常用的。
② 利用isin()判断整个df中是否包含某个值或某些值(了解)
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
df.isin(["60","70"])
结果如下:
③ 利用isin()判断df中的某列是否包含某个值或某些值(掌握)
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx")
display(df)
df["语文"].isin(["37","97"])
df1 = df[df["语文"].isin(["37","97"])]
display(df1)
结果如下:
④ 利用isin(),利用df1中的某一列,来对df2中的数据进行过滤(很重要)
df1 = pd.read_excel(r"C:Users黄伟Desktop est.xlsx",sheet_name=0)
display(df1)
df2 = pd.read_excel(r"C:Users黄伟Desktop est.xlsx",sheet_name=1)
display(df2)
x = df1["name"].isin(df2["name"])
display(x)
df1[df1["name"].isin(df2["name"])]
结果如下:
3)between()函数:返回一个布尔值,即如果在该范围内,返回True,否则返回False。
df = pd.read_excel(r"C:Users黄伟Desktop est.xlsx",sheet_name=0)
display(df)
df["数学"].between(50,70)
df[df["数学"].between(50,70)]
结果如下:
注意:此函数范围是左闭右闭区间。
相关文章
- 从本体论开始说起——运营商关系图谱的构建及应用
- 如何成为一名数据科学家?
- 从未见过的堂兄杀了人,你的DNA是关键证据
- 20个安全可靠的免费数据源,各领域数据任你挑
- 20个安全可靠的免费数据源,各领域数据任你挑
- 阿里云李飞飞:All in Cloud时代,云原生数据库优势明显
- 基于Hadoop生态系统的一高性能数据存储格式CarbonData(性能篇)
- 大数据告诉你:10年漫威,到底有多少角色
- TigerGraph:实时图数据库助力金融风控升级
- Splunk利用Splunk Connected Experiences和Splunk Business Flow 扩大数据访问
- 大数据开发常见的9种数据分析手段
- 以免在景区看人,我爬了5W条全国景点门票数据...
- 【实战解析】基于HBase的大数据存储在京东的应用场景
- 数据科学家告诉你哪些计算机科学书籍是你应该看的
- Kafka作为大数据的核心技术,你了解多少?
- Spring Boot 整合 Redis 实现缓存操作
- 大数据学习必须掌握的五大核心技术有哪些?
- 基于Antlr在Apache Flink中实现监控规则DSL化的探索实践
- 甲骨文再次被Gartner评为分析型数据管理解决方案魔力象限领导者
- 爬取吴亦凡微博102118条转发数据,扒一扒流量的真假