您现在的位置是：首页 > 其他

当前栏目

Spark on Hive【S负责SQL解析和优化（SparkSQL）、计算引擎；H只负责存储元数据；主流方式】、Hive on Spark【H负责SQL解析和优化、存储元数据；S充当计算引擎】

On 引擎存储计算 SQL 数据 Spark 优化

2023-09-27 14:20:41 时间

Hive on Spark：

Hive既作为存储元数据又负责SQL的解析优化，语法是HQL语法，
执行引擎变成了Spark，Spark负责采用RDD执行。

Spark on Hive :

Spark负责SQL解析优化，语法是Spark SQL语法，Spark负责采用RDD执行。
Hive只作为存储元数据，

1、spark on hive

hive只作为存储角色，spark 负责sql解析优化，底层运行的还是sparkRDD

具体可以理解为spark通过sparkSQL使用hive语句操作hive表，底层运行的还是sparkRDD，

步骤如下：

1.通过sparkSQL，加载Hive的配置文件，获取Hive的元数据信息

2.获取到Hive的元数据信息之后可以拿到Hive表的数据

3.通过sparkSQL来操作Hive表中的数据

2、hive on spark

hive既作为存储又负责sql的解析优化，spark负责执行

这里Hive的执行引擎变成了spark，不再是MR。

这个实现较为麻烦，必须重新编译spark并导入相关jar包

目前大部分使用spark on hive

HiveSQL和SparkSQL的区别和联系_sparksql和hivesql的区别_万里长江横渡的博客-CSDN博客

猜你喜欢

js匿名自执行函数中闭包的高级使用(---------------------------******-----------------------------)
Arbor Networks凭借业界全面的 DDoS 防御组合为各类客户提供可用性保护
【CSS】position:relative和position:absolute
python pip安装lxml失败(转)
【QT】解决VS开发QT程序，切换至release版本提示找不到相关头文件。
Activiti初学者教程
tidb的binlog同步工具TiDB Binlog
大数据必学Java基础（三十九）：面向对象三大特性之一封装(Encapsulation)
su 认证失败
Java架构师与开发者提高效率的10个工具
hibernate JPA 使用懒加载时代理对象
抓取网站数据不再是难事了，Fizzler（So Easy）全能搞定
090828 H 小道理
一个简单的监控java进程获取日志的办法
基于C#调用halcon实现模板匹配【附部分源码】
学习ASP.NET Core, 怎能不了解请求处理管道[3]: 自定义一个服务器感受一下管道是如何监听、接收和响应请求的
自己编写的str操作函数
重学前端 42 # 用代码挖掘W3C中的CSS属性
koa项目编程结构与非对称加密
开放数据——物联网的基础
OpenJudge百炼习题解答（C++)--题4040：买书问题

相关主题

Ruby on Rails
RAILS ON
v-on
on SDN
v-on指令
v - on
关键字: on
vuejs之v-on
v-bind和v-on

zl程序教程

当前栏目

Spark on Hive【S负责SQL解析和优化（SparkSQL）、计算引擎；H只负责存储元数据；主流方式】、Hive on Spark【H负责SQL解析和优化、存储元数据；S充当计算引擎】

1、spark on hive

2、hive on spark

相关文章