您现在的位置是：首页 > 云平台

当前栏目

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《数据可视化：构建实时动态运营数据分析大屏》篇

实时应用计算数据数据分析分析基于用户

2023-09-27 14:27:09 时间

实验背景介绍

了解更多2017云栖大会·杭州峰会 TechInsight Workshop.

本手册为云栖大会Workshop之《在线用户行为分析：基于流式计算的数据处理及应用》场的《数据可视化：构建实时动态运营数据分析大屏》篇所需。主要帮助现场学员熟悉并掌握DataV数据可视化的操作和使用。

实验涉及大数据产品 DataV数据可视化

必备条件：1、已经从云中沙箱中获取了实验所需的阿里云账号和密码。2、安装56版本以上的GOOGLE CHROME浏览器。

本实验将会实现如下的实时动态运营数据分析大屏大屏。

1实验目标

创建可视化大屏

经过上述《流数据处理：通过StreamSQL分析视频日志》章节创建的流式任务，我们可以创建酷炫的可视化大屏展示网站实时流量统计情况，为了便于大家快速掌握DataV的使用，请使用事先准备好的RDS数据源。

进入DataV管理控制台

点击进入DataV可视化管理控制台。

添加数据源 step1：进入DataV管理控制台，点击左侧菜单中我的数据。

我的数据

step2：点击+添加数据，跳出新建数据对话框。

添加数据

step3：配置数据类型为RDS for MySQL、名称、域名、用户名/密码、端口和数据库，点击“获取数据列表”，选择“workshop”，并点击测试连接，最后点击“完成”。

配置数据源

具体数据源配置项如下：

数据源类型：RDS for MySQL,内网，华东2 名称：workshop_rds 域名：rm-uf6t1mym355i3qdsw.mysql.rds.aliyuncs.com 用户名：root 密码：Workshop001 端口：3306 数据库：workshop
创建DataV可视化大屏 step1：点击左侧我的可视化，进入配置大屏操作；再点击2017_WORKSHOP_HZ进入大屏编辑界面。

我的可视化

step2：此处大屏模板为此次Workshop量身定制，大家直接进入配置界面即可。DATAV功能布局见图示。

流式数据实战配置界面

配置DataV数据图表

依次配置实时在线人数（数字翻牌器）、热门房间排名（轮播列表柱状图）、在线人数变化趋势（折线图）、用户卡顿率趋势（折线图）、访问设备比例（饼图）、用户故障地理分布（点热力图）。

配置实时在线人数（数字翻牌器） step1：点击数字翻牌器，进入配置实时在线人数（数字翻牌器）页面。

折线图样式

step2：点击数字翻牌器左侧“数据“选项卡，进入数据配置面板。

数据类型选择数据库，选择数据库为workshop_rds（刚创建的数据源名称）在SQL底部勾选自动更新，设置每5秒请求一次。
因为数据表包含了多条数据，需要获取最新的在线人数数据，故编写SQL如下：

数字翻牌器

附：SQL说明

SELECT 

 sum(count_value) as value 

 FROM online_num

配置热门房间排名（轮播列表柱状图）

点击轮播列表在右侧进行配置数据。统一选择数据类型为数据库，且选择数据库为之前所配置的workshop_rds。
配置热门房间排名

附：SQL说明

SELECT sum(count_value) as value, roomid as content 

FROM hot_room_num 

where 

start_time unix_timestamp()*1000 

and start_time (unix_timestamp()-100)*1000 

group by content 

order by value DESC 

limit 5

配置在线人数变化趋势（折线图） step1：同样点击在线人数变化趋势（折线图），进入数据配置页面。 step2：配置数据源。

数据类型选择数据库，选择数据库为workshop_rds（刚创建的数据源名称）在SQL底部勾选自动更新，设置每5秒请求一次。

在线人数变化趋势

附：SQL说明

 SELECT 

 count_value as y, 

 substring(start_time, 1, 19) as x

 FROM online_num

 order by start_time DESC

 limit 10

配置用户卡顿率变化趋势（折线图） step1：同样点击用户卡顿率变化趋势（折线图），进入数据配置页面。 step2：配置数据源。

数据类型选择数据库，选择数据库为workshop_rds（刚创建的数据源名称）在SQL底部勾选自动更新，设置每5秒请求一次。

用户卡顿率变化趋势

附：SQL说明

SELECT 

 block as y, 

 substring(start_time, 1, 19) as x 

 FROM block_min 

 order by start_time DESC 

 limit 10

配置访问设备比例（饼图） step1：同样点击配置访问设备比例（饼图），进入数据配置页面。 step2：配置数据源。

数据类型选择数据库，选择数据库为workshop_rds（刚创建的数据源名称）在SQL底部勾选自动更新，设置每5秒请求一次。
编写SQL如下：
配置访问设备比例

附：SQL说明

SELECT 

sum(count_value) as value, 

agent as type, 

max(start_time) as date_time 

FROM access_device 

where 

start_time unix_timestamp()*1000 

and start_time (unix_timestamp()-100)*1000

group by agent

配置播放故障率（点热力图） step1：点击地图组件，再选择点热力图层子组件。

step2：进入数据配置页面，配置数据源。

数据类型选择数据库，选择数据库为workshop_rds（刚创建的数据源名称）在SQL底部勾选自动更新，设置每5秒请求一次。
我们需要的数据包括经度、纬度和故障率，但是原始数据中，经度、纬度在一个字段中，且该字段包含空数据等脏数据；同时，故障率为0的数据我们不需要，因为对绘制热力图不起作用。这就需要我们用DATAV数据过滤器处理。先用SQL查询10000条数据，保证充足的数据量进行下一步过滤。
附：SQL说明

SELECT * FROM region_failure_rate limit 10000

step3.1 添加数据过滤器

添加数据过滤器

step3.2 将新建数据过滤器命名为“getVideoFaultValue” step3.3 编写数据过滤器

step3.4 选择应用数据过滤器“getVideoFaultValue”

附：数据过滤器代码说明

var processedData = [];

data.forEach(function(d, i) {

 if(d.remoteip +d.fault_video 0) {

 var dataObj = {};

 var latLngArray = d.remoteip.split(,);

 dataObj.lat = latLngArray[0];

 dataObj.lng = latLngArray[1];

 dataObj.value = +d.fault_video;

 processedData.push(dataObj);

return processedData;

至此我们对所有组件的数据都已经配置完成。

点击右上角预览，查看大屏效果，会看到数据实时的刷新。

大屏预览

通过发布操作可以将制作好的大屏分享别人查看。

step1：点击右上角发布，弹出发布对话框，打开发布按钮会生成链接。

发布1

复制生成的URL即可共享你的大屏作品，观看制作的流式数据大屏。其他验证密码、验证Token可以参考更多教程来完成，此处将不赘述。

到此为止，相信大家一定程度掌握了阿里云流式日志的分析及处理解决方案有了一定了解，包括Log、StreamCompute到最后的DataV大屏展示。更多内容请大家持续关注文章的更新和后续的workshop内容出品。

运营也用的起来的数据分析工具：Quick BI即席分析详解数据部门是一个容易被投诉的“高危”部门，需求响应慢、数据准确性不高会影响业务的发展。然而数据分析师每周动辄就有几十个需求在手，无限的加班也无法解决所有问题，到底怎样才能改变BI分析师的需求响应问题呢？
运营也用的起来的数据分析工具：Quick BI即席分析详解数据部门是一个容易被投诉的“高危”部门，需求响应慢、数据准确性不高会影响业务的发展。然而数据分析师每周动辄就有几十个需求在手，无限的加班也无法解决所有问题，到底怎样才能改变BI分析师的需求响应问题呢？
带你读《Python数据分析与数据化运营（第2版）》之三：10条数据化运营不得不知道的数据预处理经验这是一本将数据分析技术与数据使用场景深度结合的著作，从实战角度讲解了如何利用Python进行数据分析和数据化运营。作者是有10余年数据分析与数据化运营的大数据专家，书中对50余个数据工作流知识点、14个数据分析与挖掘主题、4个数据化运营主题、8个综合性案例进行了全面的讲解，能让数据化运营结合数据使用场景360°落地。
带你读《Python数据分析与数据化运营（第2版）》之二：数据化运营的数据来源这是一本将数据分析技术与数据使用场景深度结合的著作，从实战角度讲解了如何利用Python进行数据分析和数据化运营。作者是有10余年数据分析与数据化运营的大数据专家，书中对50余个数据工作流知识点、14个数据分析与挖掘主题、4个数据化运营主题、8个综合性案例进行了全面的讲解，能让数据化运营结合数据使用场景360°落地。
带你读《Python数据分析与数据化运营（第2版）》之一：Python和数据化运营这是一本将数据分析技术与数据使用场景深度结合的著作，从实战角度讲解了如何利用Python进行数据分析和数据化运营。作者是有10余年数据分析与数据化运营的大数据专家，书中对50余个数据工作流知识点、14个数据分析与挖掘主题、4个数据化运营主题、8个综合性案例进行了全面的讲解，能让数据化运营结合数据使用场景360°落地。
MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。
祎休阿里云MaxCompute产品经理，帮助每一个想使用大数据计算服务的同学轻松上云。

猜你喜欢

Mybatis分页插件PageHelper正确的使用方法（网上有2篇不够科学的文章）
机器学习手写KNN算法预测城市空气质量
全球APP开发商Top 10发布中国占席一半表现抢眼
解决手机訪问站点时总体相对屏幕缩小问题？（已解决）
Docker部属Nsq集群
ios可视化编程 UI高级 UI_13
学习 Docker 如何查看镜像信息？
能解决不少图片太大的问题引发的oom
我的Java开发学习之旅------>Java利用Comparator接口对多个排序条件进行处理
医疗人工智能市场有多大？
SignalR+WebRTC技术实现音视频即时通讯功能
【k8s】ing-rules-path
Cassandra入门指南--安装及配置
[2018.10.17 T2] 最优路线
【我的Android进阶之旅】快速创建和根据不同的版本类型（Dev、Beta、Release）发布Android 开发库到Maven私服
OneUI极强的 Bootstrap 管理仪表板模板
最新国内云计算服务商市场占有率排名，阿里云腾讯云华为云谁排名高
centos 单独安装PHP的mysql和mysqli扩展
Visual Prolog 的 Web 专家系统（1）
各种数据库对应的jar包、驱动类名和URL格式
如何确保混合云的安全性和性能？
SpringCloud 服务注册之nacos实现

相关主题

数据实时计算
实时结果
实时显示时间
实时计算之storm
实时监控linux

zl程序教程

当前栏目

2017云栖大会·杭州峰会：《在线用户行为分析：基于流式计算的数据处理及应用》之《数据可视化：构建实时动态运营数据分析大屏》篇

相关文章