zl程序教程

您现在的位置是:首页 >  其他

当前栏目

《Spark大数据处理:技术、应用与性能优化》——1.6 本章小结

技术应用性能Spark 优化 小结 数据处理 1.6
2023-09-11 14:19:16 时间

本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第1章,第1.6节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.6 本章小结

本章首先介绍了Spark分布式计算平台和BDAS。BDAS的核心框架Spark为用户提供了系统底层细节透明、编程接口简洁的分布式计算平台。Spark具有计算速度快、实时性高、容错性好等突出特点。基于Spark的应用已经逐步落地,尤其是在互联网领域,如淘宝、腾讯、网易等公司的发展已经成熟。同时电信、银行等传统行也开始逐步试水Spark并取得了较好效果。本章也对Spark的基本情况、架构、运行逻辑等进行了介绍。最后介绍了Spark在工业界的应用,读者可以看到Spark的蓬勃发展以及在大数据分析平台中所处的位置及重要性。
读者通过本章可以初步认识和理解Spark,更为底层的细节将在后续章节详细阐述。
相信读者已经想搭建自己的Spark集群环境一探究竟了,接下来将介绍Spark的安装与配置。


大数据知识面试题-Spark 在cluster模式下,Driver运行在YARN集群的某个节点上,使用的是没有经过配置的默认设置,PermGen永久代大小为82MB。运行报出OOM错误。
大数据Spark企业级实战与Hadoop实战&PDF和PPT 今天给大家分享的是《大数据Spark企业级实战》与《Hadoop实战》《大数据处理系统·Hadoop源代码情景分析》《50个大厂大数据算法教程》等销量排行前10名的大数据技术书籍(文末领取PDF版)。这些书籍具有以下几个优点:易读、实践性强,对解决工作中遇到的业务问题具有一定启发性。