第13课:Spark Streaming源码解读之Driver容错安全性
2023-09-27 14:26:47 时间
第13课:Spark Streaming源码解读之Driver容错安全性
/* 王家林老师授课http://weibo.com/ilovepains 每天晚上20:00YY频道现场授课频道68917580*/
1、数据层面:ReceivedBlockTracker 是专门负责管理Spark Streaming运行的元数据。跟踪数据需维持状态。
2、调度层面:DStream和JobGenerator 框架调度的层面,从业务角度考虑的。
JobGenerator(作业生成,进展到什么地步了)。
ReceivedBlockTracker 注释写的好精彩!藏龙卧虎之地
/**
* Class that keep track of all the received blocks, and allocate them to batches
* when required. All actions taken by this class can be saved to a write ahead log
* (if a checkpoint directory has been provided), so that the state of the tracker
* (received blocks and block-to-batch allocations) can be recovered after driver failure.
*
* Note that when any instance of this class is created with a checkpoint directory,
* it will try reading events f
相关文章
- Spark源码分析之Sort-Based Shuffle读写流程
- 【Dubbo 源码解析】08_Dubbo与Spring结合
- 【Redisson】二.可重入锁-lua脚本加锁逻辑源码
- 7-2-图的邻接表存储-图-第7章-《数据结构》课本源码-严蔚敏吴伟民版
- OpenCV轮廓最大内接矩形(带角度)-计算与绘制(Python / C++源码)
- Orchard源码分析(6):Shell相关
- Intellij Idea环境下Spark源码阅读环境
- qemu vl.c源码学习
- 第48课:Spark中的新解析引擎Catalyst源码Analyzer彻底详解
- 第11课:Spark Streaming源码解读之Driver中的ReceiverTracker架构设计以及具体实现彻底研究
- IMF SPARK 源代码发行定制班 预习课程 Spark框架源码的调试 (2) 从master worker main入口进行调试
- Spark商业案例与性能调优实战100课》第36课:彻底解密Spark 2.1.X中Sort Shuffle中Reducer端源码内幕.pptx>>
- 大数据Spark “蘑菇云”行动前传第5课:零基础实战Scala函数式编程及Spark源码解析
- 大数据Spark “蘑菇云”行动前传第22课:Scala集合和高级函数操作实战及Spark源码鉴赏.
- 第25课 Spark Hash Shuffle源码解读与剖析
- 第14课:Spark Streaming源码解读之State管理之updateStateByKey和mapWithState解密
- 第31课:彻底解密Spark 2.1.X中Shuffle中内存管理源码解密:StaticMemory和UnifiedMemory
- 第33课: Spark Executor内幕彻底解密:Executor工作原理图、ExecutorBackend注册源码解密、Executor实例化内幕、Executor具体工作内幕
- 大数据Spark “蘑菇云”行动第104课:Hive源码大师之路第二步:Hive真正的入口、词法分析和语法分析
- vue源码解读系列(4):为什么通过this.xxx可以访问到data的数据
- Kibana问题搜集---下载源码,执行npm install 报错
- Spark源码分析之六:Task调度(二)
- Spark源码分析之四:Stage提交