您现在的位置是：首页 > 后端

当前栏目

Spark代码中设置appName在client模式和cluster模式中不一样问题

模式 Spark 代码设置 Client 一样 cluster 问题

2023-09-27 14:19:38 时间

问题

Spark应用名在使用yarn-cluster模式提交时不生效，在使用yarn-client模式提交时生效，如图1所示，第一个应用是使用yarn-client模式提交的，正确显示我们代码里设置的应用名Spark Pi，第二个应用是使用yarn-cluster模式提交的，设置的应用名没有生效。

图1 提交应用

回答

导致这个问题的主要原因是，yarn-client和yarn-cluster模式在提交任务时setAppName的执行顺序不同导致，yarn-client中setAppName是在向yarn注册Application之前读取，yarn-cluser模式则是在向yarn注册Application之后读取，这就导致yarn-cluster模式设置的应用名不生效。

解决措施：

在spark-submit脚本提交任务时用--name设置应用名和sparkconf.setAppName(appname)里面的应用名一样。

比如我们代码里设置的应用名为Spark Pi，用yarn-cluster模式提交应用时可以这样设置，在--name后面添加应用名，执行的命令如下：

./spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster --name SparkPi lib/spark-examples*.jar 10

0x00 背景
首先，可以传入spark运行环境参数有三个地方：命令行（spark-subimit），代码（new SparkConf或SparkSession），client配置文件。
在spark提交任务时，代码里设置了appname，命令行和client配置文件都没有设置。
使用yarn-client模式提交，appname是代码里设置的。
使用yarn-cluster模式提交，appname变为执行类的全类名，例如com.aa.bb.Main。
0x01 原因
在源码里找到，如果appname设置为空，appname设置为类名。

SparkSubmitArguments源码：

可是明明在代码里设置了，为什么client模式可以，cluster模式不可以。
原因是client和cluster模式启动方式不一样（前面已经做过分析），cluster模式不会读取代码里配置，直接读取命令行配置。client模式都会读取，但是代码里优先级最高。

在给apname赋值的时候，会先取命令行传入的参数再取客户端配置文件的参数。
所以cluster模式读的是命令行配置。

猜你喜欢

Word控件Spire.Doc 【评论】教程(2)：在 C#、VB.NET 中删除和替换 Word 文档中的注释
缓存碎语一
红旗推Linux+产品战略加速生态布局
「杂谈」苏州吴中区买房有哪些选项？
JAVA异常
美国今年已问世的12家顶尖初创企业
中心极限定理与大数定理
mybatis-generator生成model和dao层代码
基于Python实现通过人口分布数据进行绘制Matplotlib散点图（Scatter）【100010097】
[Android随笔]内存泄漏以及内存溢出
基于FPGA的正弦PWM产生系统verilog实现
MyBatis自动生成工具去掉注释的配置
【最新】最流行的java后台框架 springmvc mybaits 集代码生成器 SSM SSH
《云数据管理：挑战与机遇》分布式数据管理
阿里测试总监8年测试路，如何从功能测试到自动化测试——我的坎坷谁又会知道？

相关主题

Java 策略模式
设计模式：享元模式
14.享元模式

zl程序教程

当前栏目

Spark代码中设置appName在client模式和cluster模式中不一样问题

问题

回答

解决措施：

相关文章