您现在的位置是：首页 > 数据库

当前栏目

Spark集群部署

文件集群部署下载 Spark

2023-04-18 14:41:33 时间

1. 安装环境简介

硬件环境：两台四核cpu、4G内存、500G硬盘的虚拟机。

软件环境：64位Ubuntu12.04 LTS；主机名分别为spark1、spark2，IP地址分别为1**.1*.**.***/***。JDK版本为1.7。集群上已经成功部署了Hadoop2.2，详细的部署过程可以参见另一篇文档Yarn的安装与部署。

2. 安装Scala2.9.3

1）在/home/test/spark目录下面运行wget http://www.scala-lang.org/downloads/distrib/files/scala-2.9.3.tgz命令，下载scala的二进制包。

2）解压下载后的文件，配置环境变量：编辑/etc/profile文件，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3 
export PATH=$SCALA_HOME/bin

3）运行source /etc/profile使环境变量的修改立即生效。在spark2上执行相同的操作，安装scala。

3. 下载编译好的spark文件，地址为：http://d3kbcqa49mib13.cloudfront.net/spark-0.8.1-incubating-bin-hadoop2.tgz。下载后解压。

4.配置conf/spark-env.sh环境变量，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3

5. 在/etc/profile中配置SPARK_EXAMPLES_JAR以及spark的环境变量：添加如下内容：

export SPRAK_EXAMPLES_JAR=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2/examples/target/scala-2.9.3/spark-examples_2.9.3-assembly-0.8.1-incubating.jar 
export SPARK_HOME=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2 
export PATH=$SPARK_HOME/bin

6. 修改/conf/slaves文件，在文件中添加如下内容：

spark1 
spark2

7.使用scp命令将上述文件拷贝到spark节点的相同路径下面scp -rspark-0.8.1-incubating-bin-hadoop2 test@spark2:/home/test/spark：

8. 在spark1上启动spark集群,并检查进程是否成功启动。如下master和worker已经成功启动。

使用浏览器打开http://1**.**.*.***:8080/，其显示如下所示：

可以看到集群中的两个slave节点已经成功启动。

9. 运行spark自带的例子：./run-exampleorg.apache.spark.examples.SparkPi spark://master:7077，其结果如下所示：

在web界面能看到刚才运行的job如下所示：

原文链接：http://blog.csdn.net/zhxue123/article/details/19199859

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

Spark集群部署

相关文章