您现在的位置是：首页 > 其他

当前栏目

yarn中的事件分发与状态机框架

事件框架分发 yarn 状态机

2023-06-13 09:15:23 时间

【概述】

在早之前的文章《YARN——任务提交启动流程》中提到了，其处理逻辑是围绕applicaiton、container、attempt实例对象的创建，各自状态机的变化来实现的。

具体来说，是将处理逻辑抽象为事件与事件的处理，对事件进行异步分发以及对不同事件的回调处理，同时以有限状态机来表示事件处理后的不同状态。本文就来总结下yarn中的事件异步分发处理框架以及状态机框架的使用与实现原理。

【事件异步处理分发框架】

1. 使用

对于事件异步处理框架，其使用比较简单，可分为如下几个步骤。

// 1) 创建事件异步分发处理对象
Dispatcher dispatcher = new AsyncDispatcher("RM Event dispatcher");
// 2) 注册事件以及对应的处理类对象
dispatcher.register(RMFatalEventType.class,new ResourceManager.RMFatalEventDispatcher());
// 3）初始化及启动事件分发器
dispatcher.init();
dispatcher.start();
// 4) 向事件分发器投递消息
dispatcher.getEventHandler().handle(new RMFatalEvent(RMFatalEventType.STATE_STORE_OP_FAILED, failureCause));

这里的事件处理类必须实现EventHandler接口，在handle接口中完成事件的回调处理。

public interface EventHandler<T extends Event> {
    void handle(T event);
}

private class RMFatalEventDispatcher implements EventHandler<RMFatalEvent> {
    public void handle(RMFatalEvent event) {
        ...
    }
}

2. 原理

异步事件分发处理器内部是一个经典的队列加单线程的处理模型。

在异步事件分发器内部包装了一个事件队列、一个事件分发处理类实例对象的MAP、以及一个独立的线程。

在注册事件的处理类时，以事件类型为Key，处理类实例对象为value，存储到map中（允许一个事件同时有多个处理对象）。

调用getEventHandler().handle()时，实际上是向队列中添加了一个事件对象。事件分发器内部的线程则不断从队列中取出消息，然后从map中找到事件的处理类对象实例，并调用该类对象的handle方法进行事件的处理。

小细节：

队列是没有长度限制的，可以无限往里面添加事件
如果一个事件类型，同时注册了多个处理类对象，则按照注册顺序依次调用进行回调处理。

【状态机框架】

有限状态机在编码中会经常用到，其本质上是在当前状态下，收到某个事件后，经过一定的处理，切换到下一个状态。

在hadoop中自带了状态机处理框架，并且在RM、NM内部大量运用了状态机来维护中application、attempt、container等有生命周期的信息的状态。

对于状态机框架的使用，包括如下几个步骤：

// 1. 构造状态机工厂, 并添加状态装换
StateMachineFactory<RMAppImpl, RMAppState, RMAppEventType, RMAppEvent> stateMachineFactory =
    new StateMachineFactory<RMAppImpl, RMAppState, RMAppEventType, RMAppEvent>(RMAppState.NEW).
    addTransition(
        RMAppState.NEW, // 当前状态
        RMAppState.NEW_SAVING, // 处理后的状态
        RMAppEventType.START, // 事件类型
        new RMAppNewlySavingTransition()). // 处理类对象
    addTransition(
        RMAppState.NEW, // 当前状态
        EnumSet.of( // 处理后可能的状态集
            RMAppState.SUBMITTED,
            RMAppState.ACCEPTED,
            RMAppState.FINISHED, 
            RMAppState.FAILED,
            RMAppState.KILLED,
            RMAppState.FINAL_SAVING),
        RMAppEventType.RECOVER, // 事件类型
        new RMAppRecoveredTransition()). // 处理类对象
    addTransition(...).
    installTopology();
// 2. 构造状态机实例队列
StateMachine<RMAppState, RMAppEventType, RMAppEvent> stateMachine = stateMachineFactory.make(this);
// 3. 事件处理与状态转换
stateMachine.doTransition(event.getType(), event);

首先，状态机工厂（StateMachineFactory）是一个泛型类，包含4个类型变量

OPERAND：操作该状态机的对象类型
STATE：状态机的状态实例
EVENTTYPE：将要被处理的事件类型
EVENT：具体的事件对象

其次，需要通过`addTransition`接口加入状态转换，该函数包括4个入参，分别为转换之前的状态、转换后的状态、触发的事件、事件的处理类对象。

对于该操作，状态机工厂类内部实际上是将状态转换封装成一个类，并对添加的多个状态转换以链表的形式串起来。

最后，需要调用`installTopology`完成状态机内部的拓扑构造。

这一步，在内部就是对状态转换链表转换成一个map嵌套的状态机转换表，外层以状态为key，value是一个map。内层map以事件为key，转换的操作（封装）对象为value。

状态机工厂类的定义如下所示：

final public class StateMachineFactory<OPERAND, STATE extends Enum<STATE>, EVENTTYPE extends Enum<EVENTTYPE>, EVENT> {
    private final TransitionsListNode transitionsListNode;
    private Map<STATE, Map<EVENTTYPE, Transition<OPERAND, STATE, EVENTTYPE, EVENT>>> stateMachineTable;
    private STATE defaultInitialState;
}

private class TransitionsListNode {
    final ApplicableTransition<OPERAND, STATE, EVENTTYPE, EVENT> transition;
    final TransitionsListNode next;

    TransitionsListNode(
        ApplicableTransition<OPERAND, STATE, EVENTTYPE, EVENT> transition,
        TransitionsListNode next) {
        this.transition = transition;
        this.next = next;
    }
}

事件处理类对象需要实现`SingleArcTransition`或`MultipleArcTransition`接口，在transition接口中进行事件处理动作。

SingleArcTransition表示转换后明确只有一种状态，而对于MultipleArcTransition，经过事件处理后，可能会有不同的状态，只需要是设定的状态集合中其中一个即可。

private static class RMAppTransition implements SingleArcTransition<RMAppImpl, RMAppEvent> {
    public void transition(RMAppImpl app, RMAppEvent event) {
    };
}

private static final class RMAppNewlySavingTransition extends RMAppTransition {
    @Override
    public void transition(RMAppImpl app, RMAppEvent event) {
        ...
    }
}

private static final class RMAppRecoveredTransition implements MultipleArcTransition<RMAppImpl, RMAppEvent, RMAppState> {
    @Override
    public RMAppState transition(RMAppImpl app, RMAppEvent event) {
        ...
        return RMAppState.ACCEPTED;
    }
}

状态机转换处理（doTransition）的处理逻辑，就是根据事件类型与当前的状态，从`stateMachineTable`中找到对应的处理对象，并调用其transition方法进行处理。

private class InternalStateMachine implements StateMachine<STATE, EVENTTYPE, EVENT> {
    @Override
    public synchronized STATE doTransition(EVENTTYPE eventType, EVENT event)
        throws InvalidStateTransitionException {
        listener.preTransition(operand, currentState, event);
        STATE oldState = currentState;
        currentState = 
            StateMachineFactory.this.doTransition(operand, currentState, eventType, event);
        listener.postTransition(operand, oldState, currentState, event);
        return currentState;
    }
}

final public class StateMachineFactory<OPERAND, STATE extends Enum<STATE>, EVENTTYPE extends Enum<EVENTTYPE>, EVENT> {
    private STATE doTransition(
        OPERAND operand, 
        STATE oldState, 
        EVENTTYPE eventType, 
        EVENT event)
        throws InvalidStateTransitionException {
        Map<EVENTTYPE, Transition<OPERAND, STATE, EVENTTYPE, EVENT>> transitionMap = stateMachineTable.get(oldState);
        if (transitionMap != null) {
            Transition<OPERAND, STATE, EVENTTYPE, EVENT> transition = transitionMap.get(eventType);
            if (transition != null) {
                return transition.doTransition(operand, oldState, event, eventType);
            }
        }
        throw new InvalidStateTransitionException(oldState, eventType);
    }
    
    private class SingleInternalArc implements Transition<OPERAND, STATE, EVENTTYPE, EVENT> {
        public STATE doTransition(OPERAND operand, STATE oldState, EVENT event, EVENTTYPE eventType) {
            if (hook != null) {
                hook.transition(operand, event);
            }
            return postState;
        }
    }
    
    private class MultipleInternalArc implements Transition<OPERAND, STATE, EVENTTYPE, EVENT> {
        public STATE doTransition(OPERAND operand, STATE oldState, EVENT event, EVENTTYPE eventType) throws InvalidStateTransitionException {
            STATE postState = hook.transition(operand, event);
            if (!validPostStates.contains(postState)) {
                throw new InvalidStateTransitionException(oldState, eventType);
            }
            return postState;
        }
    }
}

小技巧：

任务提交运行过程中涉及的application、container等的状态机还是非常复杂的，因此在yarn内部提供了可视化的机制，具体是通过调用`VisualizeStateMachine`对指定状态机类生成graphviz（.gv）文件，然后再用dot将其转换为png的图片，这样就可以比较直观的查看了。

【RM中的使用】

在RM中，事件分发与状态机通常是结合起来使用的，即向事件分发器注册一个事件的处理对象，在该处理对象的handle处理方法中，调用状态机进行相应的处理。其处理过程又可能是继续向事件分发器投递另外一个事件。这样在内部就形成了处理链路。yarn任务的运行调度逻辑主要就是这样进行的。对应的处理流程如下图所示：

对应的代码逻辑为：

rmDispatcher.register(RMAppEventType.class, new ApplicationEventDispatcher(rmContext));

@Private
public static final class ApplicationEventDispatcher implements EventHandler<RMAppEvent> {

    private final RMContext rmContext;

    public ApplicationEventDispatcher(RMContext rmContext) {
        this.rmContext = rmContext;
    }

    @Override
    public void handle(RMAppEvent event) {
        ApplicationId appID = event.getApplicationId();
        RMApp rmApp = this.rmContext.getRMApps().get(appID);
        if (rmApp != null) {
            try {
                rmApp.handle(event);
            } catch (Throwable t) {
                LOG.error(
                    "Error in handling event type " + event.getType() +
                    " for application " + appID, t);
            }
        }
    }
}

// RMAppImpl.java
public void handle(RMAppEvent event) {
    ...
    this.stateMachine.doTransition(event.getType(), event);
    ...
}

【总结】

本文介绍了yarn中的异步事件处理框架，状态机框架的使用，以及内部实现原理，了解了这些后，对进一步分析yarn源码会有很大的帮助。

猜你喜欢

mysql存储中使用while批量插入数据(批量提交和单个提交的区别)
java基于springboot外卖系统在线订餐系统app源码厨艺论坛APP
全文搜索和替换
SimpleQuery优化
解决WPF在XP上使用微软雅黑字体
MySQL函数：从实用简单中获得极致效果（mysql函数使用）
基于Redis的表单设计器构建（redis表单设计器）
Mysql数据库中出现1370错误如何处理（Mysql中1370报错）
stm32驱动摄像头ov7725_STM32F030F4
基于 bat 脚本配置mysql 数据库（bat配置mysql）
分析利用Linux TOP进行时间分析（linuxtop时间）
【C++】模板初阶&&STL简介
Oracle 视图 DBA_DIM_JOIN_KEY 官方解释，作用，如何使用详细说明
Linux入门教程：驾驭系统的入口（linux入门教程下载）
SQL Server中修改表的步骤（sqlserver修改表）
linux系统线程通信的几种方式,Linux的进程/线程通信方式总结
javadom4j解析xml用到的几个方法
从hudi持久化文件理解其核心概念

zl程序教程

当前栏目

yarn中的事件分发与状态机框架

相关文章