您现在的位置是：首页 > 其他

当前栏目

Spark全分布部署和HA

部署 Spark 分布 HA

2023-06-13 09:17:16 时间

全分布部署

配置文件：conf/spark-env.sh

export JAVA_HOME=/root/training/jdk1.7.0_75
export SPARK_MASTER_HOST=spark1
export SPARK_MASTER_PORT=7077
#下面的可以不写，默认
export SPARK_WORKER_CORES=1
export SPARK_WORKER_MEMORY=1024m

配置文件：conf/slave

spark2
spark3

启动Spark集群：start-all.sh

HA

基于Zookeeper的Standby Masters ZooKeeper提供了一个Leader Election机制，利用这个机制可以保证虽然集群存在多个Master，但是只有一个是Active的，其他的都是Standby。当Active的Master出现故障时，另外的一个Standby Master会被选举出来。由于集群的信息，包括Worker， Driver和Application的信息都已经持久化到ZooKeeper，因此在切换的过程中只会影响新Job的提交，对于正在进行的Job没有任何的影响。加入ZooKeeper的集群整体架构如下图所示。

1.png

参考： export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=bigdata12:2181,bigdata13:2181,bigdata14:2181 -Dspark.deploy.zookeeper.dir=/spark"

另外：每个节点上，需要将以下两行注释掉。

1.png

在原节点上执行

Spark/sbin# ./start-all.sh

在备选的Master节点上执行

Spark/sbin# ./start-master.sh

猜你喜欢

衣带渐宽终不悔，为伊消得人憔悴。愿，这份爱在你我之间没有 “跨域”
MySQL Error number: MY-010471; Symbol: ER_FAILED_TO_DECREMENT_NUMBER_OF_THREADS; SQLSTATE: HY000 报错故障修复远程处理
ACDSee 2020 v13.0.2 旗舰特别版
Jstorm 环境搭建[通俗易懂]
重识Nginx - 14 Nginx 多进程结构
不用光驱，安装Linux的新方式（无光驱安装linux）
最终linux时代的到来（endlinux）
canvas合成文字以及对文字进行换行处理
JS等比例缩小图片尺寸的实例
基于Redis群集的高可用部署实践（redis群集实例）
解决 Linux 中 GBK 编码的乱码问题（linuxgbk乱码）
Linux课程：建立一流的学习水平（linux课程标准）
企业微信H5开启调试模式
100亿参数的语言模型跑不动？MIT华人博士提出SmoothQuant量化，内存需求直降一半，速度提升1.56倍！
第117期：Dart的基本知识（变量的声明）
恢复Linux系统的图形界面（linux切换回图形界面）
MySQL Error number: MY-013316; Symbol: ER_GRP_RPL_RELEASE_BEGIN_TRX_AFTER_WAIT_FOR_SYNC_BEFORE_EXEC; SQLSTATE: HY000 报错故障修复远程处理
德国Volocopter公司试飞电动空中出租车：拟为2024年巴黎奥运会服务

zl程序教程

当前栏目

Spark全分布部署和HA

全分布部署

HA

相关文章