您现在的位置是：首页 > 其他

当前栏目

细节决定成败: 推荐系统实验反思与讨论

测试系统数据

2023-04-18 16:05:40 时间

近些年来，随着互联网的迅速发展，用户在各种在线平台上接收到海量的信息，信息爆炸成为一个关键性问题。在此背景下，推荐系统逐步渗透到人们工作生活的各个场景，已成为不可或缺的一环。它不仅可以帮助用户快速获得想要的信息和服务，还可以提高资源利用效率，从而给企业带来更多效益。因此，个性化推荐算法不仅获得了工业界广泛的关注，也是科研领域的研究热点之一。

在个性化推荐的研究中，受限于平台与效率等因素，研究者大多无法将算法部署到在线系统上进行评价，因此离线评价成为推荐领域研究的主要方式。然而个性化推荐涉及到的场景复杂，可获得的数据信息多种多样，用户行为多为隐式反馈且存在许多噪声，这使得推荐系统离线评价的实验设定复杂多变，存在大量易被忽视却十分重要的细节。比如在训练采样负例时，既可以仅从用户没有交互过的商品中采样，也可以将验证测试集的商品视作未知交互加入采样池。同样，从训练到测试在很多其他环节也涉及这样的实现细节（如数据集处理、已知负样本的使用、Top-N排序候选集范围等）。这些实验细节通常不会在学术论文中被显式提及，却潜在影响了模型效果的对比，还决定着实验的科学性，甚至会导致相反或错误的分析结论。

本文从数据集处理、模型训练、验证与测试、效果评价等多个角度，系统地讨论与反思了推荐系统实验中的细节设定。对于每个环节，我们枚举了若干常见设定，并在真实数据集上验证了其中某些设定的实际影响。实验结果表明一些细节确实会导致关于模型优劣的不同结论。最终我们形成了关于推荐系统实验细节的指导性总结，包括可选、建议、必须的三类设定，希望帮助推荐算法研究者规避实现细节上的陷阱，更科学合理地设计实验。

http://jcs.iie.ac.cn/xxaqxb/ch/reader/create_pdf.aspx?file_no=20210504&flag=1&year_id=2021&quarter_id=5

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

细节决定成败: 推荐系统实验反思与讨论

相关文章