《Storm企业级应用:实战、运维和调优》——第3章 核心概念和数据流模型
2023-09-11 14:19:09 时间
本节书摘来自华章计算机《Storm企业级应用:实战、运维和调优》一书中的第3章,作者:马延辉 陈书美 雷葆华著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第3章 核心概念和数据流模型本章从细节入手,了解Storm的核心概念,包括Stream、Spout、Bolt、Tuple、Task、Worker、Stream Grouping和Topology。Stream是被处理的数据,Spout是数据源,Bolt处理数据,Tuple是数据单元,Task是运行Spout或Bolt中的线程,Worker是运行这些线程的进程,Stream Grouping规定了Bolt接收何种类型数据作为输入。Topology是由Stream Grouping连接起来的Spout和Bolt节点网络。
另外,除了核心概念,本章还介绍数据流模型,从整体上介绍Storm,这样从微观和宏观的角度了解Storm之后,就可以更好地利用Storm这个工具来开展实时处理分析的项目。
亿级异构任务调度框架设计与实践 阿里云日志服务作为云原生可观测与分析平台。提供了一站式的数据采集、加工、查询分析、可视化、告警、消费与投递等功能。全面提升用户的研发、运维、运营、安全场景的数字化能力。 日志服务平台作为可观测性平台提供了数据导入、数据加工、聚集加工、告警、智能巡检、导出等功能,这些功能在日志服务被称为任务,并且具有大规模的应用,接下来主要介绍下这些任务的调度框架的设计与实践。
相关文章
- IO模式和IO多路复用(阻塞IO、非阻塞IO、同步IO、异步IO等概念)
- 4 个概念,1 个动作,让应用管理变得更简单
- 十张Gif动图让你弄懂递归等概念
- 你必须知道的关于大数据的七个概念
- 计算机基础系列重新整理 速率的概念(一)
- 谈谈 SAP 产品 UI 开发中的组件概念
- 【阶段三】Python机器学习01篇:机器学习概念、机器学习类别、机器学习应用场景与机器学习基本技术:特征、标签、模型
- 【Linux 内核 内存管理】内存映射原理 ② ( 内存映射概念 | 文件映射 | 匿名映射 | 内存映射原理 | 分配虚拟内存页 | 产生缺页异常 | 分配物理内存页 | 共享内存 | 进程内存 )
- 【Linux 内核】CFS 调度器 ① ( CFS 完全公平调度器概念 | CFS 调度器虚拟时钟 Virtual Runtime 概念 | 四种进程优先级 | 五种调度类 )
- 第53讲:视图的概念以及基本使用
- 第十二讲:生成树概念及STP技术应用
- 机器学习与深度学习基础概念
- Kafka核心概念
- Linux 操作系统中进程和线程的概念
- Redis缓存数据库应用概念以及Redis基本操作(一)
- 【C++要笑着学】引用的概念 | 引用的应用 | 引用的探讨 | 常引用