《Spark Cookbook 中文版》一导读
Spark 中文版 导读 Cookbook
2023-09-11 14:17:46 时间
随着Hadoop这个大数据平台的成功,用户的期望也水涨船高,他们既希望解决不同分析问题的功能提高,又希望减少延迟。由此,各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
Spark Cookbook 中文版
随着Hadoop这个大数据平台的成功,用户的期望也水涨船高,他们既希望解决不同分析问题的功能提高,又希望减少延迟。由此,各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。“Spark一出,谁与争锋”,它终结了需要使用多种工具来完成复杂挑战和学习曲线的局面。通过使用内存进行持久化存储和计算,Apache Spark避免了磁盘上的中间存储过程并将速度提高了100倍,并且提供了一个单一平台用来完成诸如机器学习、实时streaming等诸多分析作业。
第1章 [开始使用Apache Spark]()
1.1 [简介]()
1.2 [使用二进制文件安装Spark]()
1.3 [通过Maven构建Spark源码]()
1.4 [在Amazon EC2上部署Spark]()
1.5 [在集群上以独立模式部署Spark]()
1.6 [在集群上使用Mesos部署Spark]()
1.7 [在集群上使用YARN部署]()
1.8 [使用Tachyon作为堆外存储层]()
第2章 使用Spark开发应用
第3章 外部数据源
第4章 Spark SQL
第5章 Spark Streaming
第6章 机器学习——MLlib
第7章 监督学习之回归——MLlib
第8章 监督学习之分类——MLlib
第9章 无监督学习——MLlib
第10章 推荐系统
第11章 图像处理——GraphX
第12章 优化及调优
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
相关文章
- Apache Spark源码走读(八)Graphx实现剖析&spark repl实现详解
- Hudi(7):Hudi集成Spark之spark-sql方式
- Spark on k8s: 通过hostPath设置SPARK_LOCAL_DIRS加速Shuffle
- Scala模拟Spark分布式计算流程示例代码
- spark安装须知:SPARK_DIST_CLASSPATH配置
- 用命令行的方式运行Spark平台的wordcount项目
- Hadoop vs Spark
- facebook Presto SQL分析引擎——本质上和spark无异,分解stage,task,MR计算
- 用实例说明Spark stage划分原理
- Spark实战(七)spark streaming +kafka(Python版)
- 【Spark NLP】第 11 章:词嵌入
- 【Apache Spark 】第 4 章Spark SQL 和 DataFrames:内置数据源简介
- 【Spark ML】第 2 章: Spark和Spark简介