如何更有价值采集数据、高效分析数据?
上回说到,用户行为数据的意义和价值《为什么要做用户行为分析?》,以及互联网产品用户模型的构建,这其中就包含了对数据的采集和分析两大块儿,本文将从数据采集的三大要点、如何让分析更有价值更高效、以及数据分析思维三部分展开聊。
一、数据采集的三大要点
1、全面性
数据量足够具有分析价值、数据面足够支撑分析需求。
比如对于“查看商品详情”这一行为,需要采集用户触发时的环境信息、会话、以及背后的用户id,最后需要统计这一行为在某一时段触发的人数、次数、人均次数、活跃比等。
2、多维性
数据更重要的是能满足分析需求。灵活、快速自定义数据的多种属性和不同类型,从而满足不同的分析目标。
比如“查看商品详情”这一行为,通过埋点,我们才能知道用户查看的商品是什么、价格、类型、商品id等多个属性。从而知道用户看过哪些商品、什么类型的商品被查看的多、某一个商品被查看了多少次。而不仅仅是知道用户进入了商品详情页。
3、高效性
高效性包含技术执行的高效性、团队内部成员协同的高效性以及数据分析需求和目标实现的高效性。
基于以上三点,我们看如何让数据采集更准确、分析更有用以及团队内部更高效。
二、数据分析价值性和高效性
step1:明确数据驱动目标
数据采集切忌大而全,数据分析需求也是随着产品不断迭代的,明确长远和当前阶段的分析需求,让分析更有目的性,技术执行更高效。
场景举例:
小葛是公司的产品经理,小诸是技术,最近两人都认识到了数据在产品运营和决策中的重要性,经过几个数据平台的调研,最后,选择了诸葛io,并且已经明确了当前阶段的数据需求…
小葛:“小诸忙吗,文档中那个,登录流程、注册转化、购买转化、分享转化等是长远需要关注的数据指标,务必埋上哦;对于发现功能呢,两个礼拜后我们会提交一个新版本,先不埋了啦,辛苦啦。”
小诸:“小葛,你真棒,一会儿我就给你埋好了呢!”
小葛:“哦,还有,注册那个页面我们有个推荐人选项,需要用户输入推荐人账号,采集的时候别采账号啊,我只想看注册用户是否有推荐人的分布,把那个属性处理成判断哦”
小诸:“这简单。那今晚…”
看着小葛转身要离开了,小诸欲言又止,默默地继续敲代码了…
step2:按需采集数据
带着需求和分析目标去采数据,不仅避免了数据冗余带来的无从下手,也避免了全量采集之后却不知道要分析什么的尴尬。
图示为埋点范例:
图示文档可由数据分析需求人员整理,表格梳理让需求人员和技术人员协同更高效,也大大提升了后续的分析价值和效率
step3:多维交叉定位问题
对数据的应用可分为一般分析和探索性分析。一般分析包括对日常数据如新增、活跃、留存、核心漏斗的监测分析,也包括对各部门日常业务的数据监测。监测每日增长,分析异常情况,比如对注册失败、支付失败事件的监控和及时优化。
探索性分析是对数据的高级应用。对核心事件的相关性分析、挖掘产品改进关键点等,如促进用户购买的相关性分析、找到促进留存的Ahamoment等。
step4:优化产品、优化运营策略
基于数据反映的问题,做到实时监控和及时解决,基于分析得到的增长启发,去做A/B测试、灰度测试、去MVP实践。
step5:衡量
衡量是数据分析到实践的最后一步,当然,也可能是第一步。有时候我们看似找到了增长点,但实验发现,事实并不如预期,不要灰心,不要丧气,更不要不吃饭,分析过程中对用户的理解、对业务的深度挖掘可能会让下一次优化产生累计价值。
三、数据分析思维
数据采集固然重要,数据分析的方法论也很重要,但不要迷信数据,因为更重要的,可能是人的创造力和想象力!数据分析也从来不是一劳永逸的,产品在不断迭代,业务在不断更新,从认知到决策,数据更多的是起到了辅助的作用,从梳理需求、到采集、到分析、到实践、再到衡量,它是始终循环在企业增长的整个过程中的。
最后,那些改变世界的程序猿,他们始终希望能用自己的技术创造更多的价值,很多时候,他们要的可能是明确的数据需求、明确的分析目标,以及一套高效协同的方法,毕竟,谁都认为:能准确解决问题、能驱动业务增长,更!重!要!
本文作者:韩重明 诸葛io
来源:51CTO
高效数据通道支撑生产情况实时分析与可视化 EMQ生产数据可视化解决方案海量保障生产数据传输和持久化的实时性、可靠性、安全性,为大数据分析、人工智能应用提供良好数据基础。
支持高频数采、实时流计算的储能可预测维护系统方案 通过EMQ云边一体化方案,可实现数据高频率的数万点位采集,为边缘端赋予实时分析和预测储能系统运行状态的能力,使云端具备大数据分析能力。
基于海量日志和时序数据的质量建设最佳实践 在云原生和DevOps研发模式的挑战下,一个系统从开发、测试、到上线的整个过程中,会产生大量的日志、指标、事件以及告警等数据,这也给企业质量平台建设带来了很大的挑战。本议题主要通过可观测性的角度来讨论基于海量日志和时序数据的质量建设最佳实践。
数据分析之「数据探查」—帮您快速掌握数据情报 为了帮助用户一眼看穿当前数据的质量、结构、分布、统计信息,Dataworks数据分析系统提供了数据探查这个情报管家。它支持探查概览、支持探查详情、支持数据筛选、支持数据刷新、支持数据分布直方图动态装箱和多级下钻!我们会在电子表格顶部以图形和富文本的形式,智能展示每列数据类型和值分布的概览情况;同时,也支持切换到详细模式,查看更多更全面的数据信息。
日志服务数据加工:成本优化指南 数据加工主要解决用户规整数据的痛点以及进一步挖掘数据价值, 降低时间与人力成本, 另一方面, 合理配置也可以节约一定财务费用. 本文介绍了如何以较优的成本方式使用数据加工.
相关文章
- 数据可视化:如何选择图表
- 消除视觉Transformer与卷积神经网络在小数据集上的差距
- 如何制作数据可视化大屏:教你30分种快速制作一(成果预览)
- 【Qt开发】如何将内存图像数据封装成QImage V1
- 【DSP开发】如何获得浮点型的数据的IEEE的表示
- 如何将枯燥的大数据呈现为可视化的图和动画?
- 大数据舆情情感分析,如何提取情感并使用什么样的工具?(贴情感标签)
- php获取POST数据的三种方法
- 如何设计公司内部的数据平台
- 操作excel文件爬取nvd.nist数据
- Informatica如何利用数据3.0助力业务
- 法国大数据:智慧城市中的大数据
- 利用大数据打通政务信息孤岛
- 威胁情报 = 数据 + 人
- 展望2017 Commvault支招企业如何应对数据洪流
- 大数据时代的投资机遇有哪些
- 如何找出企业内部的“暗数据”?
- Hadoop工具如何形成SAP Hana的大数据平台
- 第139课: Spark面试经典系列之数据倾斜解决之对于两个RDD数据量都很大且倾斜的Key特别多如何解决?
- 2017年新春报喜!热烈祝贺王家林老师大数据经典著作《SPARK内核机制解析及性能调优》 畅销书籍 出版上市!
- 如何把 excel 的数据导入到数据库里面去
- EMC市场调查揭示中国大数据应用趋势
- 2012年数据库与大数据领域回顾与展望
- 如何使用labelImg标注数据集,最详细的深度学习标签教程
- 大数据物流项目:主题及指标开发之如何对Kudu表数据分析【离线报表分析(1个主题)】(十)
- 如何在 Docker 容器之间共享数据
- 10月23日云栖精选夜读:如何让数据价值最大化?阿里全域大数据系统深度解读
- 客快物流大数据项目(三十六):安装ElasticSearch-7.6.1
- angularJs——利用深拷贝angular.copy()实现取消编辑功能(编辑前保存之前数据,取消后恢复原始数据)