大数据学习——关于hive中的各种join
2023-09-11 14:18:37 时间
准备数据
2,b
3,c
4,d
7,y
8,u
2,bb
3,cc
7,yy
9,pp
建表: create table a(id int,name string) row format delimited fields terminated by ','; create table b(id int,name string) row format delimited fields terminated by ',';
导入数据: load data local inpath '/root/hivedata/a.txt' into table a; load data local inpath '/root/hivedata/b.txt' into table b;
inner join 只打印能匹配上的数据,没有匹配上的不输出
select * from a inner join b on a.id =b.id;
left join
select * from a left join b on a.id=b.id;
right join
select * from a right join b on a.id=b.id;
full outer join
select * from a full outer join b on a.id=b.id;
left outer join
left semi join
select * from a left semi join b on a.id=b.id;
相当于
select * from a where a.id exists(select b.id from b); 在hive中效率极低
相关文章
- 神经网络与机器学习 笔记—单神经元解决XOR问题
- JavaScript 的入门学习案例,保证学会!
- (《机器学习》完整版系列)第5章 神经网络——5.3 SOW网络(“灯阵”面板)、Elman网络(将训练集转化时序数据)、Boltzmann机(达到Boltzmann分布)
- 机器学习数学笔记|大数定理中心极限定理矩估计
- 【MATLAB教程案例53】CNN卷积神经网络的MATLAB编程学习和实现,以手势识别为例进行仿真分析
- 《机器学习与R语言(原书第2版)》一3.3 总结
- Go分布式爬虫学习笔记(十)
- HTML标签简明学习一
- 《Python机器学习——预测分析核心算法》——2.3 对“岩石vs.水雷”数据集属性的可视化展示
- Redis学习手册(服务器管理)
- (数据科学学习手札09)系统聚类算法Python与R的比较
- 大数据学习——spark安装
- 大数据学习——kettle的简单使用
- 大数据学习——flume拦截器
- 大数据学习——shell编程
- 机器学习和大数据——提高信用卡安全性
- Oracle数据库学习笔记(一)
- Spring5学习笔记——day01
- SQL学习之高级数据过滤
- hive 学习笔记 (二)---窗口函数(开窗函数部分)
- DLS广告平台:大数据、学习、分享是核心