您现在的位置是：首页 > 大数据

当前栏目

《Hadoop海量数据处理：技术详解与项目实战》一导读

hadoop 技术项目详解实战数据处理导读海量

2023-09-11 14:17:45 时间

2013年被称为“大数据元年”，标志着世界正式进入了大数据时代，而就在这一年，我加入了清华大学苏州汽车研究院大数据处理中心，从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起，Hadoop就深刻地改变了人们处理数据的方式。

Hadoop海量数据处理：技术详解与项目实战
为什么要写这本书
2013年被称为“大数据元年”，标志着世界正式进入了大数据时代，而就在这一年，我加入了清华大学苏州汽车研究院大数据处理中心，从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起，Hadoop就深刻地改变了人们处理数据的方式。作为一款开源软件，Hadoop能让所有人享受到大数据红利，让所有人在大数据时代站在了同一起跑线上。Hadoop很好地诠释了什么是“大道至简，衍化至繁”，Hadoop来源于非常朴素的思想，但是却衍生出大量的组件，让初学者难以上手。

我在学习和工作的过程中，走过很多弯路也做过很多无用功，尽管这是学习新技术的必由之路，但却浪费了大量的时间。我将自己学习和工作的心得记录下来，为了帮助更多像我当年一样的Hadoop学习者，我决定写一本书，一本自己开始Hadoop职业生涯的时候也想读到的书。

第1章绪论
1.1 Hadoop和云计算
1.2 Hadoop和大数据
1.3 数据挖掘和商业智能
第2章环境准备
第3章 Hadoop的基石：HDFS
3.1 认识HDFS
3.2 HDFS读取文件和写入文件
3.3 如何访问HDFS
第4章分而治之的智慧：MapReduce
第5章 SQL on Hadoop：Hive
第6章 SQL to Hadoop : Sqoop
第7章 Hadoop性能调优和运维
应用篇：商业智能系统项目实战
第8章在线图书销售商业智能系统
第9章系统结构设计
第10章在开发之前
第11章实现数据导入导出模块
第12章实现数据分析工具模块
第13章实现业务数据的数据清洗模块
第14章实现点击流日志的数据清洗模块
第15章实现购书转化率分析模块
第16章实现购书用户聚类模块
第17章实现调度模块
结束篇：总结和展望
第18章总结和展望

【Hadoop技术篇】hive的优化，经典面试 1）开启配置：set hive.optimize.bucketmapjoin = true; 2）一个表的bucket数是另一个表bucket数的==整数倍== 3） bucket列 == join列 4）满足map join条件
异步社区异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区，也是国内领先的IT专业图书社区，致力于优质学习内容的出版和分享，实现了纸书电子书的同步上架，于2015年8月上线运营。公众号【异步图书】，每日赠送异步新书。

猜你喜欢

《惢客创业日记》2020.10.02（周五）找到了一个引路者
BZOJ 3514 Codechef MARCH14 GERALD07加强版 Link-Cut-Tree+划分树
等保测评机构是什么意思？是什么性质的单位？
java的反射机制相关方法(未完)
下游系统访问思考
centos 7 安装appache 服务器
王春晖：发展自主知识产权的网安核心技术迫在眉睫
sqlserver脱机时ldf文件丢失重建
maven项目打包额外lib目录
12-Trie树
《惢客创业日记》2021.03.28-29（周日）套路和骗子的区别
linux下如何远程调试busybox？
【PAT乙级】1022 D进制的A+B (20 分)
linux查看网卡信息的几种方法（命令）
不再只是未来，物联网已成当下最重要技术
Qt编写视频监控系统70-OSD标签和图形信息（支持写入到文件）
MySQL的xml中对大于，小于，等于的处理转换
小师妹学JVM之:JIT中的PrintAssembly续集
Prometheus + Spring Boot 应用监控
Swift - 给表格的单元格UITableViewCell添加图片，详细文本标签
WWDC21 学习系列之 01 Xcode Cloud 云是什么中文教程
Azure DevOps 添加访问代码权限 add code access permission
《Maven官方文档》POM文件（二）
nginx做正向代理（Centos7，支持http和https）
Linux tr命令详解

相关主题

Hadoop生态系统
Hadoop安装教程
hadoop shell 命令
[Hadoop] MapReduce
hadoop技术
Hadoop YARN
Hadoop - HDFS操作
Hadoop环境搭建
hadoop的概念
Hadoop分布式部署
Hadoop序列化
Hadoop：DataNode
Hadoop学习：
Hadoop学习2
Hadoop总结
Hadoop的安装

zl程序教程

当前栏目

《Hadoop海量数据处理：技术详解与项目实战》一导读

相关文章