3分钟,看懂用户偏好分析
大家好,我是爱学习的小xiong熊妹。
一提到用户画像,很多人直观地会想到:通过用户画像分析出用户偏好。到底用户偏好该如何做分析,今天简单分享下,给大家一个懒人攻略。
一、如何量化用户偏好
直观上看,用户偏好,就是
A用户喜欢产品甲
B用户喜欢产品乙
问题是:如何通过数据的形式,把这个关系表达出来。
最简单的方法是:
- 把用户分类标注出来(如上边的A用户、B用户)
- 把产品标准出来(比如甲产品、乙产品)
- 设定“喜欢”的标准,比如一周内购买2次以上
- 计算每个用户,符合“喜欢”产品的人数
如下图,A、B用户各抽100人,观察其对甲乙产品“喜欢”的人数,这样就能简单的把“喜欢”表达出来了。
二、如何评价用户偏好
如果真如上边例子的话,用户的喜好是很明显的。把人数换算成比例,可以清晰看到:抽出的100名A用户,90%都喜欢甲产品,抽出的100名B用户,90%都喜欢乙产品。那肯定两类用户喜好不同。
但实际情况会很纠结,比如下图这种情况。理论上,年轻人喜欢喝汽水,中年喜欢喝茶,老年喜欢喝牛奶。但是在数据上看,其比例差异也就不到20%。很多时候会让人纠结:到底年龄和饮料之间有没有关系呀?
这时候可以用统计学中独立性检验,一定程度减少纠结。
三、什么是独立性检验
(大家可以直接略过这一段)独立性检验是一种基础方法。所谓独立性检验,指的是其利用了“两个互独立的事件同时发生的概率,等于两件事单独发生的概率的乘积”的原理进行检验。
独立性检验的原假设是两个变量独立。大家知道,原假设就是要被怼翻的,所以如果假设检验不通过(P值小于0.05),就能拒绝原假设,认为两个变量有关系。
四、如何做独立性检验
具体的统计学原理稍显复杂,既然是懒人攻略,那么就直接给操作步骤:
第一步:根据题目,给出观察数据
第二步:计算期望频数数据
第三步:使用公式计算卡方检验结果
大家直接看P值就好了,小于0.05,推翻原假设,年龄和饮料选择之间不独立,可认为差异是真实存在的。
五、背后的问题
上边虽然给了很多方法,但是一定要注意:用户喜好并不是固定不变的,过去的数据参考意义会很有限。
- 比如把“偏好”定义为购买。那么购买很可能受到价格、品牌、口碑等多方面影响。
- 比如把“偏好”定义为浏览页面。那么浏览行为很可能受到标题党、蹭热点等影响。
可能一个促销活动,一个蹭热点的标题,就把前边发现的结论推翻了。
总之,通过简单的数据定义出来的“偏好”,可能不是真正的偏好,其中夹杂了大量的其他原因。需要更多方法来剔除这些原因。今天就讲到这里啦,大家感兴趣的话,记得转发+在看+点赞,三连,支持下小熊妹哦,谢谢大家。
相关文章
- 直接在代码里面对list集合进行分页
- .NET Framework 4.5新特性详解
- 大数据的简要介绍
- 大数据的由来
- 高斯混合模型的自然梯度变量推理
- timing-wheel 仿Kafka实现的时间轮算法
- 使用Navicat软件连接自建数据库(Linux系统)
- 那一天,我被Redis主从架构支配的恐惧
- Redis 深入了解键的过期时间
- C#使用委托调用实现用户端等待闪屏
- 基于流计算 Oceanus 和 Elasticsearch Service 构建百亿级实时监控系统
- GRAND | 转录调控网络预测数据库
- JFreeChart API中文文档
- 临床相关突变查询数据库
- TIGER | 人类胰岛基因变化查询数据库
- 视频边缘计算网关EasyNVR在视频整体监控解决方案中的应用分析
- Apache Arrow - 大数据在数据湖后的下一个风向标
- 常见的电商数据指标体系
- AKShare-艺人数据-艺人流量价值
- MySQL中多表联合查询与子查询的这些区别,你可能不知道!