做了这么多年Java程序员,我想转大数据了
做了这么多年Java开发,如何快速转行大数据
分享转行经验路线
对于Java程序员,大数据的主流平台hadoop是基于Java开发的,所以Java程序员往大数据开发方向转行从语言环境上更为顺畅,另外很多基于大数据的应用框架也是Java的,所以在很多大数据项目里掌握Java语言是有一定优势的。
当然,hadoop核心价值在于提供了分布式文件系统和分布式计算引擎,对于大部分公司而言,并不需要对这个引擎进行修改。这时候除了熟悉编程,你通常还需要学习数据处理和数据挖掘的一些知识。尤其是往数据挖掘工程师方向发展,则你需要掌握更多的算法相关的知识。
对于数据挖掘工程师而言,虽然也需要掌握编程工具,但大部分情况下是把hadoop当做平台和工具,借助这个平台和工具提供的接口使用各种脚本语言进行数据处理和数据挖掘。因此,如果你是往数据挖掘工程方向发展,那么,熟练掌握分布式编程语言如scala、spark-mllib等可能更为重要。
Java程序员转大数据工程师的学习路线图:
***步:分布式计算框架
掌握hadoop和spark分布式计算框架,了解文件系统、消息队列和Nosql数据库,学习相关组件如hadoop、MR、spark、hive、hbase、redies、kafka等;
第二步:算法和工具
学习了解各种数据挖掘算法,如分类、聚类、关联规则、回归、决策树、神经网络等,熟练掌握一门数据挖掘编程工具:Python或者Scala。目前主流平台和框架已经提供了算法库,如hadoop上的Mahout和spark上的Mllib,你也可以从学习这些接口和脚本语言开始学习这些算法。
第三步:数学
补充数学知识:高数、概率论和线代
第四步:项目实践
- 1)开源项目:tensorflow:Google的开源库,已经有40000多个star,非常惊人,支持移动设备;
- 2)参加数据竞赛
- 3)通过企业实习获取项目经验
如果你仅仅是做大数据开发和运维,则可以跳过第二步和第三步,如果你是侧重于应用已有算法进行数据挖掘,那么第三步也可以先跳过。
相关文章
- 从0到1 手把手教你建一个区块链
- Java:枚举类型
- java基于ssm开发的宠物商城宠物店源码
- Java基于springboot大学生宿舍寝室考勤人脸识别管理系统
- Java基于ssm师生实验课-实验室-实验设备预约系统源码
- Java并发基础面试题
- Java的动态代理与RPC
- Java-设计模式
- 关于Java中的时间处理,你真的了解吗?
- JAVA项目启动脚本编写及JVM启动参数的一些笔记
- 如何用 JAVA 实现一个基于 POI 的复杂表格导出工具类?
- 关于JAVA 中volatile使用的一些笔记
- 从零开始构建人脸识别模型(附实例和Python代码)
- JAVA自动拆装箱、equals与==比较
- Java向上转型和向下转型
- JSON快速入门(Java版)-imooc
- 2023.1最新IDEA激活码分享(持续更新中)
- Nginx 了解一下?
- 棋盘覆盖问题(Java)
- 最优二叉搜索树问题(Java)