您现在的位置是：首页 > 云平台

当前栏目

《Spark Cookbook 中文版》一1.1　简介

Spark 简介中文版 1.1 Cookbook

2023-09-11 14:17:46 时间

本节书摘来异步社区《Spark Cookbook 中文版》一书中的第1章，第1.1节，作者：【印度】Rishi Yadav（亚达夫）译者：顾星竹 , 刘见康责编：胡俊英，更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.1 简介

Apache Spark是一个用于处理大数据工作流的多功能集群计算系统。Spark在速度、易用性以及分析能力上都强于它的前辈们（如MapReduce）。

Apache Spark最初在2009年，由加州大学伯克利分校的AMPLab实验室研发，在2010年按照BSD协议实现开源，并在2013年转为Apache 2.0协议。到2013年下半年，Spark的创始人建立了Databricks，专注于Spark的研发和未来的公开发行。

谈到速度，Spark大数据工作流的处理可以达到亚秒级别的延迟。为了达到如此低的延迟，Spark充分利用了内存。在MapReduce中，内存仅仅用于实际计算，而Spark不仅使用内存进行计算，而且还用于存储对象。

Spark也提供一个连接各种大数据存储源的统一运行时接口，例如HDFS、Cassandra、Hbase和S3。它同时也提供大量的用于不同的大数据计算任务的顶层库，例如机器学习、SQL处理、图像处理以及实时数据流。这些库加快了开发速度，可以任意组合。

虽然Spark是用Scala所写，本书也只关注Scala部分的教程，但是Spark也支持Java和Python语言。

Spark是一个开源社区产品，每个人都是用Apache纯开源分布部署，不像Hadoop，有大量开发商改进的分布部署。

图1-1展示了Spark的生态圈。

Spark运行时运行在一系列集群管理器的基础之上，包括YARN（Hadoop的计算框架）、Mesos以及Spark自己的被称为独立模式的集群管理器。Tachyon是一个内存层的分布式文件系统，使得集群架构之间的文件共享速度能够可靠到达内存级别。（译注：Tachyon现已更名为alluxio，官网地址：www.alluxio.org。本书的其他部分仍会按照原文写作Tachyon，后续不再赘述。）简而言之，它是内存上的一个堆外存储层，用于在任务和用户之间分享数据。Mesos 是一个涉及数据中心处理系统的集群管理器。YARN是一个有着健壮的资源管理特性的Hadoop计算框架，Spark可以与它无缝连接使用。

《Spark Cookbook 中文版》一导读随着Hadoop这个大数据平台的成功，用户的期望也水涨船高，他们既希望解决不同分析问题的功能提高，又希望减少延迟。由此，各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。
异步社区异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区，也是国内领先的IT专业图书社区，致力于优质学习内容的出版和分享，实现了纸书电子书的同步上架，于2015年8月上线运营。公众号【异步图书】，每日赠送异步新书。

猜你喜欢

学习笔记(51):Python实战编程-ListBox
SpringMVC 转发、重定向
Python学习---PyCharm的使用学习
Linux中命令链接操作符的十个最佳实例
python pip 安装
大型连锁百货运维审计用什么软件好？有哪些功能？
微信小程序组件客服
大数据强商业
链表算法letcode
Windows 2003 Server远程代码执行漏洞集合
Programming clojure – Recursion and Lazy-seq
坑爹的BFC;块格式上下文
macOS SwiftUI 封装组件之可设置高度搜索框NSSearchField（教程含源码）
ssh免秘钥登录
克莱门特公司在俄罗斯一个数据中心安装其新型冷却系统
算法补天系列之中级提高班1
ROCE_CANAL硬件使用手册
李宏毅_机器学习介绍_1
【C++】cmake第一战-余生消bug
C# 之文件的输入与输出
SQL Server-聚焦过滤索引提高查询性能
java 启动Selenium 以及端口占用的问题

相关主题

大数据 -- Spark
Spark SQL
Spark学习笔记
Spark性能优化
Spark 网络
Spark集群安装
Spark简介
Spark Shuffle
spark安装
Spark UI
Spark 配置项
spark 简介
Spark-快速上手
spark入门（1）
spark优化
spark-sql
spark 分区
Hadoop、spark
hive、spark

zl程序教程

当前栏目

《Spark Cookbook 中文版》一1.1　简介

相关文章

当前栏目

《Spark Cookbook 中文版》一1.1 简介

相关文章

《Spark Cookbook 中文版》一1.1　简介