您现在的位置是：首页 > 数据库

当前栏目

【大数据】Hive SQL执行全过程源码解析(Hive3.1)

SQL 源码执行数据解析 hive 全过程

2023-09-11 14:21:26 时间

Hive执行SQL的主要流程及Hive架构

Hive执行SQL的主要流程图

看着有很多阶段，实际上很简单。Hive就是把SQL通过AST解析，然后遍历若干次(进行算子替换以及优化)，最后再次遍历算子，如果为reduceSink操作符则划分出一个stage，类似Spark中通过shuffle来划分stage，生成MapReduce任务。最后将这些任务按照执行计划的顺序提交到Yarn上执行。

Hive架构图

源码解读

由于源码含有非常多的细节，暂时忽略非重要细节

执行SQL的主要入口方法为Driver.runInternal,该方法涉及了整个Hive SQL执行流程，从SQL到编译，解析，执行，收集返回结果。

首先该方法中会判断SQL是否经过编译，若未进行编译，则会调用compileInternal -> compile方法。

SQL -> compile -> genPlan

org/apache/hadoop/hive/ql/Driver.compile

对生成的AST进行分析，生成计划

AST -> Task

这部分会用到BaseSemanticAnalyzer.analyze，大致流程是先通过SemanticAnalyzerFactory.get(queryState, tree)，初始化BaseSemanticAnalyzer对象,并且确定了SQL的类型，SQL的类型以及使用了哪些算子都在org/apache/hadoop/hive/ql/parse/HiveParser.g语法文件中枚举出来了。

然后通过sem.analyze(tree, ctx)调用analyzeInternal

而 analyzeInternal是一个抽象方法，有很多种实现：

具体实现比较复杂，大概意思就是对语法树进行递归，把每个节点用switch枚举匹配，替换成Hive的算子。

Task -> QueryPlan

这部分直接实例化一个QueryPlan对象，实际上就是把上一步的结果给copy出来组成了一个新对象。

其中存放task的属性未：

  private ArrayList<Task<? extends Serializable>> rootTasks;
  private FetchTask fetchTask;

QueryPlan -> Job

前面部分把编译的流程大致梳理了一遍，现在我们看下任务的提交与执行。

Driver.execute():

launchTask 会将任务提交到Yarn，先继续往下看：

最终会调用 TaskRunner.runSequential()

最终调用task.execute()，而execute是抽象方法，有很多中类型，都有不同的实现。

参考：
https://blog.csdn.net/zyzzxycj/article/details/102861166?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

猜你喜欢

iOS开发UI篇—多控制器和导航控制器简单介绍
七个合法学习黑客技术的网站，让你从萌新成为大佬
387集Go语言核心编程培训视频教材整理 | 数组和切片（一）
Java实现 LeetCode 643 子数组最大平均数 I（滑动窗口）
制作单机俄罗斯方块游戏心得（二）
Java实现 LeetCode 661 图片平滑器（暴力）
1.2什么是神经网络
python中读取配置文件的方式
CICD详解（一）——概念和原理
【CSS】标签显示模式 ④ ( 标签显示模式示例 | 设置行内元素宽高 | 设置鼠标经过样式 | 设置文字水平居中 | 设置文字垂直居中 | 文本行高与盒子高度关系 )
【学习总结】win7下安装Ubuntu双系统的日常
1V1手把手实战教学，微搭低代码中如何上传图片
OnLoad vs. Page_Load vs. Load event [转]
[FAQ] Error occured while trying to proxy to: xx.xx.x.xx:xx/xx
[ASP.NET]重构Session确实让代码简洁干净了不少
go语言web开发系列之二十四:用imagemagick为上传图片生成缩略图
详解图像处理的算术运算与逻辑运算
Mac ndk编译for Android

相关主题

SQL数据库基础
SQL存储过程
sql 笛卡尔积
SQL-union
oracle/sql.
[SQL]SQL 执行顺序

zl程序教程