《Storm企业级应用:实战、运维和调优》——1.5 Storm的功能
本节书摘来自华章计算机《Storm企业级应用:实战、运维和调优》一书中的第1章,第1.5节,作者:马延辉 陈书美 雷葆华著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.5 Storm的功能Storm有许多应用领域:实时分析、在线机器学习、持续计算、分布式RPC(远过程调用协议,一种通过网络从远程计算机程序上请求服务)、ETL(Extraction-Transformation-Loading的缩写,即数据抽取、转换和加载)等。下面介绍Storm的三大主要应用。
(1)信息流处理(stream processing)
Storm可用来实时处理新数据和更新数据库,兼具容错性和可扩展性,即Storm可以用来处理源源不断流进来的消息,处理之后将结果写入某个存储中。
(2)持续计算(continuous computation)
Storm可进行连续查询并把结果即时反馈给客户端,如把Twitter上的热门话题发送到浏览器中。
(3)分布式远程程序调用(distributed RPC)
Storm可用来并行处理密集查询。Storm的拓扑结构是一个等待调用信息的分布函数,当它收到一条调用信息后,会对查询进行计算,并返回查询结果。例如,分布式RPC可以做并行搜索或者处理大集合的数据,通过配置DRPC服务器,将Storm的Topology发布为DRPC服务。客户端程序可以调用DRPC服务将数据发送到Storm集群中,并接收处理结果的反馈。这种方式需要DRPC服务器转发,其中DRPC服务器底层通过Thrift实现。适合的业务场景主要是实时计算,且扩展性良好,可以增加每个节点的Worker数量来动态扩展。
本书将针对这些应用场景,介绍广告实时计算系统、语音“实时墙”等多个案例,这些案例是从不同领域、不同行业角度的总结分析。但是万变不离其宗,目的是参考以上Storm的三大应用,将Storm切实应用到行业生产中。
《Storm企业级应用:实战、运维和调优》——导读 大数据是继云计算、物联网之后IT行业又一大颠覆性的技术变革。之前大数据在互联网、军事、金融、通信和物理学等领域已有不少落地案例,却因为近年来Hadoop技术的快速发展而引起业界广泛关注。可以说,Hadoop目前是大数据处理的关键技术,也是迄今为止,最成熟、应用最广泛的技术。
相关文章
- qt实现web服务器加载vue应用进行C++和html混合编程-连载【6】-企业级系统开发实战连载系列 -技术栈(vue、element-ui、qt、c++、sqlite)
- iOS 11开发教程(十六)iOS11应用视图之删除空白视图
- "多模态数字内容生成"的技术探索与应用实践-借鉴篇
- 手把手教你快应用接入微信H5网页支付
- 《Microsoft.NET企业级应用架构设计(第2版)》——1.2 谁是架构师
- 《Microsoft.NET企业级应用架构设计(第2版)》——1.4 笑到最后
- 《Microsoft.NET企业级应用架构设计(第2版)》——2.3 走出混乱
- 《Microsoft.NET企业级应用架构设计(第2版)》——导读
- 「基于Django的全民健康智慧中医数字服务平台」前端应用API接口功能(二)
- 《Storm企业级应用:实战、运维和调优》——1.2 Storm是什么
- 《Storm企业级应用:实战、运维和调优》——1.4 Storm的特性
- 《Storm企业级应用:实战、运维和调优》——2.5 本章小结
- 《Storm企业级应用:实战、运维和调优》——3.6 Task任务
- 《Storm企业级应用:实战、运维和调优》——3.7 Worker工作者进程
- 《Storm企业级应用:实战、运维和调优》——3.11 本章小结