您现在的位置是：首页 > 其他

当前栏目

2021年最新最全Flink系列教程__Flink容错机制(五)

存储教程状态

2023-04-18 12:56:37 时间

day05_Flink容错机制

今日目标

Flink容错机制之Checkpoint
Flink容错机制之重启策略
存储介质StateBackend
Checkpoint 配置方式
状态恢复和重启策略
Savepoint手动重启并恢复
并行度设置

Flink状态管理

状态就是基于 key 或者算子 operator 的中间结果
Flink state 分为两种： Managed state - 托管状态， Raw state - 原始状态
Managed state 分为两种：
1. keyed state 基于 key 上的状态支持的数据结构 valueState listState mapState broadcastState
2. operator state 基于操作的状态字节数组， ListState

Flink keyed state 案例

Flink operator state 案例

Flink的容错机制

checkpoint ：某一时刻,Flink中所有的Operator的当前State的全局快照,一般存在磁盘上。

checkpoint 的执行流程

触发checkpoint ， JobManager 主节点
JobManager 触发 barrier 信号，给 source -> transformation -> sink ，都会触发，将当前算子 operator state 保存到 HDFS 或者本地文件上，每个operator 都备份完，当前一个 checkpoint 就执行完毕了。

存储介质

memoryStatebackend 生产环境不推荐
FsStatebackend 就是存储到 HDFS 或者本地文件系统上，都可以用于生产环境。
RocksdbStatebackend 先在本地进行存储，异步增量的存储到 HDFS 文件系统上，一般支持大的中间state 场景

Checkpoint 配置方式

状态恢复和重启策略

Savepoint 手动重启并恢复

并行度设置

并行度设置四种
1. 算子级别
2. 全局并行度
3. 客户端（黑窗口）并行度
4. 配置文件设置
优先级
1. 算子级别 => 2. 全局的并行度设置 => 3.客户端设置并行度 => 4.配置文件并行度

猜你喜欢

pycharm怎么设置自动错误提示
怎么在当前路径下启动jupyter？
RapidJson递归去除空值元素Value
LeetCode笔记：232. Implement Queue using Stacks
怎么在jupyter中添加文件？
LeetCode笔记：234. Palindrome Linked List
怎么在jupyter安装r？
LeetCode笔记：235. Lowest Common Ancestor of a Binary Search Tree
pycharm下如何导入模块
pycharm中的模块在哪里看
LeetCode笔记：237. Delete Node in a Linked List
pycharm找不到python怎么办
[译]TensorFlow Serving RESTful API
pycharm中文乱码怎么解决？
LeetCode笔记：238. Product of Array Except Self
怎么在prompt打开spyder？
Spring Boot 2.6 重磅发布!!!
怎么调spyder的背景字体？
如何让人模仿猎豹走路？Stuart Russell提出基于最优传输的跨域模仿学习
pycharm怎么运行

zl程序教程