您现在的位置是：首页 > 后端

当前栏目

协同过滤推荐算法：基于用户的最近邻推荐

算法基于用户推荐过滤协同最近

2023-09-27 14:20:17 时间

基于用户的最近邻推荐

如何判断用户喜欢什么东西？我们可以利用与该用户相似的人群，看看他们喜欢什么商品，然后推荐给该用户。

1.计算用户相似度：Pearson相关系数

下面表格给出了一个用户-物品评分矩阵。

表1 协同推荐的评分数据库

	物品1	物品2	物品3	物品4	物品5
Alice	5	3	4	4	?
用户1	3	1	2	3	3
用户2	4	3	4	3	5
用户3	3	3	1	5	4
用户4	1	5	5	2	1

约定：用户集合 $U=\{u_1,...,u_n\}$ ，产品集合 $P=\{p_1,...,p_m\}$ ，评分矩阵 $\{ r_{i,j}|1\le i\le n,1\le j\le m\}$ 。

Pearson相关系数定义如下：

$sim(a,b)=\frac{\sum_{p\in P}(r_{a,p}-\bar r_a)(r_{b,p}-\bar r_b)}{\sqrt{\sum_{p\in P}(r_{a,p}-\bar r_a)^2}\sqrt{\sum_{p\in P}(r_{b,p}-\bar r_b)^2}}\tag1$

Perason相关系数从+1（强正相关）到-1（强负相关）。Alice 和用户1、用户2、用户3、用户4的相关系数分别为0.85、0.70、0.00、-0.79。

注意：Pearson相关系数中，数据是基于每个用户给产品评分的平均数计算的，也就是排除了有些用户喜欢高分，有些用户喜欢低分的偏好习惯。

2.预测用户偏好

Alice 会对物品5评多少分？

我们有理由选择用户1、用户2作为 Alice 的邻近用户。把用户1、用户2对物品5评分的偏差做一个加权平均，其中权重是用户1、用户2和 Alice 的相关系数。于是我们可以得到用户 $a$ 对物品 $p$ 的评分预测：
$pred(a,p)=\bar r_a+\frac{\sum_{b\in N}sim(a,b)(r_{b,p}-\bar r_b)}{\sum_{b\in N}sim(a,b)}\tag2$
在这个例子中，基于近邻用户1和用户2的评分预测Alice对物品5的评分为：
$4+\frac{0.85*(3-2.4)+0.7*(5-3.8)}{0.85+0.7}=4.87$

3.小结

Pearson 相关系数在基于用户的的最近邻推荐算法中一般来讲由于其他相关系数计算方法
提供了不错的思路，是一种最基本的推荐算法。事实上还存在一些需要解决的问题。例如，有些产品普遍得到用户的好评，另外有些产品的用户评价则参差不齐，对前者评价的预测和对后者评价的预测的意义肯定大不相同。另外实际应用中的用户-产品评价矩阵往往是稀疏的，这也导致一些改进技术陆续登场。

猜你喜欢

Java对关于两个地点的根据经纬度算出后排序
测试用例设计指南之生命周期及编写要素
华为OD机试 - 聚餐地点（JavaScript） | 机试题+算法思路+考点+代码解析【2023】
【Java入门】常量和变量
洛谷 SP14932 LCA - Lowest Common Ancestor
PHP Record the number of login users
《C#零基础入门之百识百例》（四十五）类的属性 -- 单例模式
Python循环结构用法
《Puppet实战手册》——第2章 Puppet语言和风格 2.1简介
Mysql5.6压缩包安装到windows&& 卸载命令
[算法]最小的K个数和数据流中的中位数
arduino调试GY-MPU9250 9DOF九轴/9轴姿态传感器
WebService
【分享-世界著名的免费摄影图库】素材中国, 高清壁纸 - PxHere摄影图库
【C#进阶3-4】C#设计模式
Linux或Windows下安装及配置Erlang和RabbitMQ，所需相关安装包和文件，包含多个版本
VC6 鼠标钩子最简单样例
Microsoft TFS 如何显示在Windows 的上下文菜单中
JVM内存模型和结构
Web安全测试FAQ
合并排序的数组
Angular 简单的Post

相关主题

算法-排序算法
寻路算法
双指针算法
高级算法
算法提高 P1001
算法5-6：Kd树