问我大数据怎么入门,我总结了亲身体验的学习路线推荐给她【推荐收藏】
我正在参加年度博客之星评选,请大家帮我投票打分,您的每一分都是对我的支持与鼓励。
2021年「博客之星」参赛博主:Maynor大数据
https://bbs.csdn.net/topics/603955366
前言
大家好,我是程序员Manor,我希望自己能成为国家复兴道路的铺路人,大数据领域的耕耘者,平凡但不甘于平庸的人。
前两天有学妹私信我说,她已经上完大一,大数据专业的,只学过大数据导论,问我大数据该如何入门?我不禁感慨普通高校擅长培养算法人才,但在工程人才的培养上存在很多的问题。
恰好期末考完,在等待回家这段有时间,manor
为大家整理了一份我学大数据学习路线,在B站均能找到视频:
学习路线思维导图:
第一部分大数据技术(离线)
0.快速体验大数据:8天零基础入门大数据
这段课程我是疫情在家学习的,当时黑马线上基础班免费,当时就报名(白嫖 ),能从0开始学习大数据课程,了解linux、kettle、BI、mysql、从基础到实践,快速体验完整的大数据预处理+ETL+BI展示全链路过程
缺点是B站上没有给到配套资料,这里安利一下我的公众号:大数据智能ai
基础班的配套资料虚拟机已经更新到公众号了,关注后自行获取即可。
1.掌握一门语言,首选Java
大数据开发有三种语言可选,Java,Python和Scala,Scala后期是必学的,Java在开发中好比是屠龙刀,而Python是随身匕首,适合写写脚本,所以强烈推荐先学Java,这里推荐黑马的Java基础课程视频,
黑马最新JavaSE零基础入门到入土(idea版)
如果学习周期太长的话,只要能完成控制台上的增删改查
就可以了
B站上还有其他视频
例如:
动力节点的JavaSE课程:缺点是用Eclipse讲的
狂神的SE入门课程:优点:学习编程的一些前置知识,相当贴近实战。
2.hadoop零基础学习(HDFS、MapReduce、Yarn、Hive)
Hadoop学习,黑马和尚硅谷两家机构都不错,我这里由于自学的时候主要学了黑马的,便贴出黑马的链接
Hadoop从零到精通完整版
尚硅谷(更多人的选择):
【尚硅谷】Hadoop2.x框架入门教程丨案例实战,好评如潮
前置知识还要学习Linux,manor
为大家准备好了Linux最全学习笔记:
大数据开发工程师基本功修炼之史上最全Linux学习笔记
另外学有余力,还想进一步提升可学:
新出的hadoop3*0
Hadoop3.0-MapReduce从入门到精通
尚硅谷讲的最新Hive版本
3.Hive离线数仓项目
这里推荐的是黑马的离线项目:
黑马大数据项目——电商流量分析项目实战
缺点是不给配套资料
尚硅谷的离线数仓
尚硅谷的配套资料全,学的人也多
我个人学的是另一个项目,在线教育数仓项目
由于特殊原因视频无法分享,各位可看我写的笔记,自行研究一番
补充:其他的小组件如zookeeper、Flume、Impala和sqoop等建议花2~3个小时自学
这些组件都是工作中不经常用的,建议只花少量的时间学习,快速入门即可
这里贴出部分视频
sqoop
Flume
Azkaban
到此为止,大数据离线阶段就学完了,完结撒花🎉·🎉·
我们进入到第二部分大数据离线+实时技术阶段~
第二部分大数据技术(离线+实时)
0.海量数据存储HBase从入门到精通
Hbase公司用的很多,Kudu与其相似
1.消息队列Kafka从入门到精通
大数据必须掌握的缓存中间件
2.大数据-语言-scala
同样是搞大数据开发必学的语言,原因是Spark是基础scala开发的
3.大数据-框架-Spark
4.Spark离线实时项目
学完Spark后,可做一个项目实战检验一下学习成果。
5.大数据-框架-Flink
进阶:
FlinkSQL
Flink源码解析课程
6.Flink实时项目
这也是我将要学的Flink项目,暑假必拿下~
进阶:
推荐系统项目、
机器学习的书籍:稍后为各位整理出来,在我的公众号领取
可适当阅读一些数仓书籍,有益于理论深化
如:
《阿里巴巴的大数据之路》
《数据仓库工具箱—维度建模的完全指南》
❤️往期精彩回顾❤️:
「机器学习」推荐系统简介——一起来看看你是怎么被大数据杀熟的(四)
❤️大数据开发必备:推荐7款大数据开发神器工作效率提升1000%【推荐收藏】
学了1年大数据,来测测你大数据技术掌握程度?大数据综合复习之面试题15问(思维导图+问答库)
手把手教你完成第一个JS项目:用简单到极致的贪吃蛇游戏熟悉JS语法
总结
到这里恭喜你把
大数据的主流技术
学完了,如果你还有什么不懂,可随时问我,私信我,如果C站没有回复你,可在公众号后台加我好友,备注:C站来的。
希望以上能够帮到刚入门大数据的你!
相关文章
- Andrew Ng机器学习课程17(1)
- 人工智能-损失函数-优化算法:梯度下降【SGD-->SGDM(梯度动量)-->AdaGrad(动态学习率)-->RMSProp(动态学习率)-->Adam(动态学习率+梯度动量)】、梯度下降优化技巧
- Matplotlib学习---用matplotlib画面积图(area chart)
- 机器学习、数据科学、人工智能、深度学习、统计学等的区别
- 菜鸟学习Hibernate——配置Hibernate环境
- WPF学习之数据绑定
- SpringBoot学习笔记-6:第六章 Spring Boot 与数据访问
- 机器学习:数据特征预处理缺失值处理
- 《Web安全之机器学习入门》一 1.5 算法和数据的辩证关系
- [数据库/数据分析/数据工程]数据工程的学习资源【待续】
- 建议收藏【机器学习&练习 θ】逻辑回归(详细分析:数据可视化、sigmoid 函数、代价函数和梯度、评价 逻辑回归模型 等知识...)
- PyQt(Python+Qt)学习随笔:视图中类QAbstractItemView的dragDropOverwriteMode属性
- PyQt(Python+Qt)学习随笔:Qt Designer中部件的geometry几何属性
- PyQt学习随笔:Model/View开发时在view数据项中设置不同角色数据的方法
- 从入门到上手写脚本/爬数据/搭网站,有哪些快速学习Python的技巧
- 大数据开发工程师基本功修炼之Linux学习笔记(二)
- 普通码农入门机器学习,必须掌握这些数据技能
- 【深度学习 招式篇】制作VOC数据集必看! 各种快捷所需python代码 YOLO 训练自己的数据集
- abp学习资料
- PHP 数据库驱动、连接数据不同方式学习笔记
- iOS学习笔记(4) — UITableView的 重用机制
- python学习之美多商城(二十一):购物车部分:购物车数据的增查改删、商品选中状态、购物车全选、合并购物车