云小课|MRS基础原理之Oozie任务调度
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。
![](https://pic3.zhimg.com/80/v2-4f664f22e786254465c1eb2488bd28f6_720w.webp)
摘要:Oozie是一个基于工作流引擎的开源框架,它能够提供对Hadoop作业的任务调度与协调。Oozie是一个工作流引擎服务器,用于运行MapReduce任务工作流。同时Oozie还是一个Java Web程序,运行在Tomcat容器中。
本文分享自华为云社区《【云小课】EI第41课 MRS基础原理之Oozie任务调度》,作者: Hello EI。
Oozie是一个基于工作流引擎的开源框架,它能够提供对Hadoop作业的任务调度与协调。
Oozie是一个工作流引擎服务器,用于运行MapReduce任务工作流。同时Oozie还是一个Java Web程序,运行在Tomcat容器中。
![](https://pic1.zhimg.com/80/v2-44683716bf806ca946f1e9e6e5525e5c_720w.webp)
Oozie工作流通过HPDL(一种通过XML自定义处理的语言,类似JBOSS JBPM的JPDL)来构造。包含“Control Node”(可控制的工作流节点)、“Action Node”。
“Control Node”用于控制工作流的编排,如“start”(开始)、“end”(关闭)、“error”(异常场景)、“decision”(选择)、“fork”(并行)、“join”(合并)等。
Oozie工作流中拥有多个“Action Node”,如MapReuce、Java等。
所有的“Action Node”以有向无环图DAG(Direct Acyclic Graph)的模式部署运行。所以在“Action Node”的运行步骤上是有方向的,当上一个“Action Node”运行完成后才能运行下一个“Action Node”。一旦当前“Action Node”完成,远程服务器将回调Oozie的接口,这时Oozie又会以同样的方式执行工作流中的下一个“Action Node”,直到工作流中所有“Action Node”都完成(完成包括失败)。
![](https://pic3.zhimg.com/80/v2-41718ac67914a7f63bb774a096b486da_720w.webp)
![](https://pic4.zhimg.com/80/v2-064bd602c8faa6e006e2b030d9da45af_720w.webp)
Oozie工作流提供各种类型的“Action Node”用于支持不同的业务需要,如MapReduce,HDFS,SSH,Java以及Oozie子流程。
如何使用Oozie
购买包含有Oozie组件的MRS集群后,用户即可使用Oozie进行作业提交及调度。
MRS集群的创建可参考MRS快速入门中的“创建集群”章节,例如购买MRS 3.1.0普通模式(关闭Kerberos认证)集群。
Oozie客户端的安装可以参考MRS用户指南的“安装客户端”章节,例如客户端安装目录为:“/opt/client”。
1.以客户端安装用户,登录安装客户端的节点。
2.执行以下命令,切换到客户端安装目录。
cd /opt/client
source bigdata_env
3.上传Oozie配置文件以及Jar包至HDFS(UserOozie为提交任务的用户名)。
hdfs dfs -mkdir /user/UserOozie
hdfs dfs -put -f /opt/client/Oozie/oozie-client-*/examples /user/UserOozie/
4.修改任务执行配置文件:
cd /opt/client/Oozie/oozie-client-*/examples/apps/map-reduce/ vi job.properties nameNode=hdfs://hacluster resourceManager=Yarn ResourceManager主节点IP地址:端口 ##端口可通过“yarn.resourcemanager.port”参数查询,例如8032。 queueName=default examplesRoot=examples user.name=admin oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce #hdfs上传路径 outputDir=map-reduce oozie.wf.rerun.failnodes=true
5.运行oozie任务:
oozie job -oozie https://oozie角色的主机名:21003/oozie/ -config job.properties -run [root@kwephispra44947 map-reduce]# oozie job -oozie https://kwephispra44948:21003/oozie/ -config job.properties -run ...... job: 0000000-200730163829770-oozie-omm-W
6.登录FusionInsight Manager,选择“集群 > 服务 > Oozie ”。
7.单击“oozie WebUI”后的超链接进入Oozie页面,在Oozie的WebUI上查看任务运行结果。
![](https://pic4.zhimg.com/80/v2-2b0f3b9adf5d73f016c9bcd9851d20cb_720w.webp)
关于Ooize应用开发及相关样例代码介绍,请参考《Oozie开发指南》。
好了,本期云小课就介绍到这里,快去体验MapReduce(MRS)更多功能吧!猛戳这里
相关文章
- 【C语言】计算器
- 将模型转为NNIE框架支持的wk模型第一步:tensorflow->caffe
- 不同数据库模式下DATE类型的行为解析
- 探索专有领域的端到端ASR解决之道
- 再不解决延迟不当,小心你的内存被打爆
- CG行业云渲染服务的演进之路
- 云小课 | 华为云KYON之L2CG
- 做开发,这几种锁机制你不得不了解一下
- 超详细的jQuery的 DOM操作,一篇就足够!
- 解密华为云FusionInsight MRS新特性:一架构三湖
- 一文带你认识MindSpore新一代分子模拟库SPONGE
- MindSpore:不用摘口罩也知道你是谁
- 技术干货 | 基于MindSpore更好的理解Focal Loss
- 云小课|DSC帮您管数据,保障您的云上数据安全
- 多方安全计算:隐私保护集合求交技术
- 保障实时音视频服务体验,华为云原生媒体网络有7大秘籍
- 云小课 | 玩转HiLens Studio之手机实时视频流调试代码
- 浅析决策树的生长和剪枝
- OCR性能优化:从认识BiLSTM网络结构开始
- 520特辑丨码神VS爱神:盘点程序员的四大男友力,你偏爱哪一种?