您现在的位置是：首页 > 数据库

当前栏目

3分钟，看懂用户偏好分析

数据产品

2023-04-18 14:27:48 时间

大家好，我是爱学习的小~~xiong~~熊妹。

一提到用户画像，很多人直观地会想到：通过用户画像分析出用户偏好。到底用户偏好该如何做分析，今天简单分享下，给大家一个懒人攻略。

一、如何量化用户偏好

直观上看，用户偏好，就是

A用户喜欢产品甲

B用户喜欢产品乙

问题是：如何通过数据的形式，把这个关系表达出来。

最简单的方法是：

把用户分类标注出来（如上边的A用户、B用户）
把产品标准出来（比如甲产品、乙产品）
设定“喜欢”的标准，比如一周内购买2次以上
计算每个用户，符合“喜欢”产品的人数

如下图，A、B用户各抽100人，观察其对甲乙产品“喜欢”的人数，这样就能简单的把“喜欢”表达出来了。

二、如何评价用户偏好

如果真如上边例子的话，用户的喜好是很明显的。把人数换算成比例，可以清晰看到：抽出的100名A用户，90%都喜欢甲产品，抽出的100名B用户，90%都喜欢乙产品。那肯定两类用户喜好不同。

但实际情况会很纠结，比如下图这种情况。理论上，年轻人喜欢喝汽水，中年喜欢喝茶，老年喜欢喝牛奶。但是在数据上看，其比例差异也就不到20%。很多时候会让人纠结：到底年龄和饮料之间有没有关系呀？

这时候可以用统计学中独立性检验，一定程度减少纠结。

三、什么是独立性检验

（大家可以直接略过这一段）独立性检验是一种基础方法。所谓独立性检验，指的是其利用了“两个互独立的事件同时发生的概率，等于两件事单独发生的概率的乘积”的原理进行检验。

独立性检验的原假设是两个变量独立。大家知道，原假设就是要被怼翻的，所以如果假设检验不通过（P值小于0.05），就能拒绝原假设，认为两个变量有关系。

四、如何做独立性检验

具体的统计学原理稍显复杂，既然是懒人攻略，那么就直接给操作步骤：

第一步：根据题目，给出观察数据

第二步：计算期望频数数据

第三步：使用公式计算卡方检验结果

大家直接看P值就好了，小于0.05，推翻原假设，年龄和饮料选择之间不独立，可认为差异是真实存在的。

五、背后的问题

上边虽然给了很多方法，但是一定要注意：用户喜好并不是固定不变的，过去的数据参考意义会很有限。

比如把“偏好”定义为购买。那么购买很可能受到价格、品牌、口碑等多方面影响。
比如把“偏好”定义为浏览页面。那么浏览行为很可能受到标题党、蹭热点等影响。

可能一个促销活动，一个蹭热点的标题，就把前边发现的结论推翻了。

总之，通过简单的数据定义出来的“偏好”，可能不是真正的偏好，其中夹杂了大量的其他原因。需要更多方法来剔除这些原因。今天就讲到这里啦，大家感兴趣的话，记得转发+在看+点赞，三连，支持下小熊妹哦，谢谢大家。

猜你喜欢

计算机组成原理相关话题,计算机组成原理基本的知识点.doc
用计算机打印出1000,惠普打印机1000一直连不上win7系统电脑
史上最简单的带流控功能的http server
static使用方法小结
python 3Des 加密
家居行业数字化供应链系统建设解决方案
未来的的趋势Go？来看看Go的增强版Go+吧【保姆教程向，十分钟写Demo】
仪器仪表行业商业数字化供应链系统解决方案
CAS博客｜首批进入临床试验的AI设计的候选药物：结构新颖性评估
服装行业数智化供应链系统转型解决方案
「Python」语言元素、分支结构和循环结构
java对象的创建过程
分布式ID
布隆过滤器
教你一个恶作剧
你对常量池够了解吗
TRUNCATE TABLE原理解析
Ubuntu18 绑定静态IP
教你一招，安卓手机秒变服务器
【连载】如何掌握openGauss数据库核心技术？秘诀一：拿捏SQL引擎（4）

zl程序教程