zl程序教程

您现在的位置是:首页 >  其他

当前栏目

大数据框架和数仓高频面试题总结

面试题框架数据 总结 高频 数仓
2023-09-11 14:20:00 时间

目录

Hadoop

Hive 

Hbase

Spark

协作组件 

数仓


Hadoop

1、简答说一下hadoop的map-reduce编程模型

MapReduce计算模型主要由三个阶段构成:Map、shuffle、Reduce。

Map是映射,负责数据的过滤分法,将原始数据转化为键值对;Reduce是合并,将具有相同key值的value进行处理后再输出新的键值对作为最终结果。为了让Reduce可以并行处理Map的结果,必须对Map的输出进行一