推荐系统(3):相似性度量
系统 推荐 度量 相似性
2023-09-14 09:14:56 时间
目录
0. 相关文章链接
1. 什么是相似性度量
基于用户的推荐和基于物品的推荐都需要找相似,即需要找相似用户以及相似物品。比如一个男生和一个女生是朋友,不能讲该女生穿的衣服推荐给男生。要找相似。那么衡量的指标有哪些?比如皮尔逊相关系数、欧式距离、同现相似度、Cosine相似度、Tanimoto系数等。
2. 皮尔逊相关系数
皮尔逊相关系数是介于1到-1之间的数,他衡量两个一一对应的序列之间的线性相关性。也就是两个序列一起增大或者一起减小的可能性。两个序列正相关值就趋近1,否者趋近于0。
数学含义:两个序列协方差与二者方差乘积的比值,如果比较两个人的相似度,那么他们所有共同评价过的物品可以看做两个人的特征序列,这两个特征序列的相似度就可以用皮尔逊相关系数去衡量。物品的相似度比较也是如此。
皮尔逊对于稀疏矩阵表现不好,可以通过引入权重进行优化。
3. 欧式距离
将两个人所有共同评价过的物品看做这个人的特征,将这些特征看做是空间中的点,计算两点之间的距离。
4. 同现相似度
物品i和物品j的同相似度公式定义:
其中,分母是喜欢物品i的用户数,而分子则是同时喜欢物品i和物品j的用户数。因此,上述公式可用理解为喜欢物品i的用户有多少比例的用户也喜欢j (和关联规则类似)
但上述的公式存在一个问题,如果物品j是热门物品,有很多人都喜欢,则会导致Wij很大,接近于1。因此会造成任何物品都和热门物品交有很大的相似度。为此我们用如下公式进行修正:
这个格式惩罚了物品j的权重,因此减轻了热门物品和很多物品相似的可能性。(也归一化了[i,j]和[j,i])
注:其他推荐系统相关文章链接由此进 -> 推荐系统文章汇总
相关文章
- Java项目毕业设计:基于springboot+vue的电影视频网站系统「建议收藏」
- 工具推荐|ESMValTool地球系统模式评估工具
- 深入理解推荐系统:大厂如何进行CTR增量训练
- SIGIR'22 推荐系统:自引导隐式反馈去噪
- WWW'22 推荐系统 | MCL:混合中心损失用于协同过滤
- 推荐系统常用指标(续):MRR、MAP、HR、F-score
- 老梁闲聊:推荐系统真的是信息茧房吗?
- web3.0卡牌链游项目系统开发源码解决方案(成熟技术)
- Django基于用户画像的电影推荐系统源码
- 下周二晚云原生正发声 l 云原生在高并发游戏推荐系统中的实践
- 盘点5类推荐系统中图学习解决冷启动问题的方法
- ICLR2023推荐系统投稿论文集锦
- 客服系统即时通讯IM开发(三)访客实现一对一聊天-访客生成唯一id标识存储到全局变量【唯一客服】网站在线客服系统
- 【Go WEB进阶实战】开源的电商前后台API系统
- 推荐系统遇上深度学习(十六)--详解推荐系统中的常用评测指标
- Win11如何下载安装Photoshop永久使用,win11系统安装PS教程+干货分享
- 借助PXE启动Linux系统:配置简单快捷(pxe启动linux)
- Linux系统负载分析报告(linux负载分析)
- 了Linux系统故障:无法启动(linux系统起不来)
- 熟悉Linux系统下的SCSI设备使用(linuxscsi设备)
- 调优最佳的Linux系统TCP参数调优实践(linuxtcp参数)
- 深入Linux:探索操作界面(linux系统操作界面)
- 使用tar命令备份Linux服务器系统(tar备份linux系统)
- Linux进程:不同类型构建系统框架(linux进程类型)
- QEMU在Linux系统中的应用(qemulinux)
- 嵌入式Linux系统实现精简裁剪(嵌入式linux系统裁剪)
- 从零开始学习Linux系统,推荐几本必读的教程书籍(linux教程书籍)
- js获取系统的根路径实现介绍