搭建一个完整的实时日志统计平台
2023-09-27 14:19:50 时间
搭建一个完整的实时日志统计平台
在互联网应用中,不管是哪一种处理方式,其基本的数据来源都是日志数据,例如对于web应来
说,则可能是用户的访问日志、用户的点击日志等。
如果对于数据的分析结果在时间上有比较严格的要求,则可以采用在线处理的方式来对数据进行分析,如使用Flink进行处理。比较贴切的一个例子是天猫双十一的成交额,在其展板上,我们看到交易额是实时动态进行更新的,对于这种情况,则需要采用在线处理。下面要介绍的是实时数据处理方式,即基于Flink的在线处理,在下面给出的完整案例中,我们将会完成下面的几项工作:
1.如何一步步构建我们的实时处理系统(Flume+Kafka+Flink+Redis)。
2.实时处理网站的用户访问日志,并统计出该网站的PV(访问量)、UV(独立访客),IP。
3.将实时分析出的PV、UV动态地展示在我们的前端页面上。
1.1 架构图
即从上面的架构中我们可以看出,其由下面的几部分构成:
Flume集群
Kafka集群
Flink集群
从构建实时处理系统的角度出发,我们需要做的是,如何让数据在各个不同的
相关文章
- python3 使用flask_socketio实时推送服务器状态(top)和 日志信息(tail)
- 【嵌入式开发】树莓派+官方摄像头模块+VLC串流实时输出网络视频流
- 推荐系统:实时推荐/信息流推荐【适合“快消“类产品】【放首页】【相比于传统推荐每天更新用户的推荐结果,实时推荐基于用户最近几秒的行为实时调整用户的推荐结果;将传统的 T+1(按天)推荐调整为秒级推荐】
- 大数据-计算引擎-实时数据分析框架:Flink【替代SparkStreaming】
- 《构建实时机器学习系统》一3.3 利用 Pandas 分析实时股票报价数据
- 如何从零构建实时的个性化推荐系统?
- Keras入门(六)模型训练实时可视化
- 基于express+redis高速实现实时在线用户数统计
- sql server常有的问题-实时错误'91' 对象变量或with块变量未设置
- 浪潮E7 v4服务器同步升级 为实时分析和内存计算优化
- 【云原生】阿里云ARMS业务实时监控
- 基于Canal和Kafka实现MySQL的Binlog近实时同步
- Flink大数据实时计算系列-第一个程序JAVA版本-分组统计 lambda写法
- 集成友盟统计、添加自定义事件并实时查看上报情况
- ubuntu18.04部署DXSLAM,CNN+VSLAM,CPU实时运行
- 实时即未来,大数据项目车联网之驾驶行程主任务定义【十六】
- 数据仓库实时数据同步方案
- 湖仓一体电商项目(十五):实时统计商品及一级种类、二级种类访问排行业务需求和分层设计及流程图
- 2018-2-13-win10-uwp-隐藏实时可视化
- 实时备份工具之inotify+rsync