zl程序教程

您现在的位置是:首页 >  大数据

当前栏目

《Hadoop海量数据处理:技术详解与项目实战(第2版)》一基础篇:Hadoop基础

hadoop技术项目基础 详解 实战 数据处理 海量
2023-09-11 14:17:47 时间

本节书摘来异步社区《Hadoop海量数据处理:技术详解与项目实战(第2版)》一书中的基础篇,作者: 范东来 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

基础篇:Hadoop基础

Hadoop海量数据处理:技术详解与项目实战(第2版)
本书的第一部分相当于工具的使用手册,将会介绍Hadoop的核心组件:HDFS、YARN、MapReduce、Hive、Sqoop和HBase,并在此基础上,进一步学习Hadoop性能调优和运维。通过这部分的学习,读者将获得Hadoop工程师的理论基础。


【Hadoop技术篇】hive的优化,经典面试 1) 开启配置:set hive.optimize.bucketmapjoin = true; 2) 一个表的bucket数是另一个表bucket数的==整数倍== 3) bucket列 == join列 4) 满足map join条件
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。