您现在的位置是：首页 > 系统

当前栏目

一文看懂推荐系统：排序14：PNN模型（Product-based Neural Networks），和FNN一个作者，干掉FM，加上LR+Product

系统排序一个模型推荐一文 14 based

2023-09-11 14:15:38 时间

一文看懂推荐系统：排序14：PNN模型（Product-based Neural Networks），和FNN一个作者，干掉FM，加上LR+Product

提示：最近系统性地学习推荐系统的课程。我们以小红书的场景为例，讲工业界的推荐系统。
我只讲工业界实际有用的技术。说实话，工业界的技术远远领先学术界，在公开渠道看到的书、论文跟工业界的实践有很大的gap，
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。

王树森娓娓道来**《小红书的推荐系统》**
GitHub资料连接：http://wangshusen.github.io/
B站视频合集：https://space.bilibili.com/1369507485/channel/seriesdetail?sid=2249610

提示：文章目录

文章目录

一文看懂推荐系统：排序14：PNN模型（Product-based Neural Networks），和FNN一个作者，干掉FM，加上LR+Product
一、动机
二、PNN模型细节
- 2.1 PNN模型整体结构
2.2 IPNN
- 2.3 OPNN![在这里插入图片描述](https://img-blog.csdnimg.cn/4edfb78828e54fcea18fcca978fd6571.png)
总结

一、动机

PNN模型（Product-based Neural Networks）和上一篇博客介绍的FNN模型一样，
都是出自交大张伟楠老师及其合作者，

这篇paper发表在ICDM’2016上，是个CCF-B类会议，
这个模型我个人基本上没听到过工业界哪个公司在自己的场景下实践过，
但我们依然可以看看这篇paper的成果，
也许能为自己的业务模型提供一些参考借鉴意义。

通过这个模型的名字Product-based Neural Networks，
我们也基本可以略知PNN是通过引入product（可以是内积也可以是外积）来达到特征交叉的目的。

这篇博客将从动机和模型细节两方面进行介绍。

动机方面：

这篇paper主要改进的是上一篇博客介绍的FNN，FNN主要存在两个缺点：

DNN的embedding层质量受限于FM的训练质量。

在FM中进行特征交叉时使用的是隐向量点积，
把FM预训练得到的embedding向量送入到MLP中的全链接层，
MLP的全链接层本质上做的是特征间的线性加权求和，即做的是『add』的操作，
这与FM有点不太统一。

另外，MLP中忽略了不同的field之间的区别，全部采用线性加权求和。
论文原文为：

the quality of embedding initialization is largely limited by the factorization machine.、
More importantly, the “add” operations of the perceptron layer might not be useful to explore the interactions of categorical data in multiple fields. Previous work [1], [6] has shown that local dependencies between features from different fields can be effectively explored by feature vector “product” operations instead of “add” operations.
其实个人认为FNN还有个很大的局限性：
FNN是个两阶段训练的模型，并不是个data-driven的end-to-end模型，
FNN身上还是有浓厚的传统机器学习的影子。

二、PNN模型细节

2.1 PNN模型整体结构

PNN的网络结构如下图所示（图片摘自原论文）

在这里插入图片描述

其实原图不应该画成那么简单
应该像下图一样

明确zp是要映射到lz lp的
在这里插入图片描述

其实z就是LR部分
因此本模型实际上是LR+PNN

在这里插入图片描述

2.2 IPNN

在product层，对特征embedding向量做交叉，

理论上可以是任何操作，这篇paper给出了两种方式：内积和外积，

分别对应IPNN和OPNN。

从复杂度的角度来看，IPNN复杂度低于OPNN，
因此如果打算工业落地的话，就不要考虑OPNN了，因此我会比较详细的介绍IPNN。

IPNN，即在product层做内积操作，
依据上面给出的内积定义，能够看出两个向量的内积结果为一个标量。形式化的表示为：

在这里插入图片描述
上面这一串公式一上，估计还有兴趣看这篇博客的人不足10%了，太晦涩难懂了。

想要别人看的懂，最简单的办法就是举例子，
咱们直接上例子，
假设咱们样本有3个特征，每个特征的embedding维度为2，即N = 3 , M = 2
所以咱们有如下一条样本：
在这里插入图片描述

2.3 OPNN

总结

提示：如何系统地学习推荐系统，本系列文章可以帮到你

（1）找工作投简历的话，你要将招聘单位的岗位需求和你的研究方向和工作内容对应起来，这样才能契合公司招聘需求，否则它直接把简历给你挂了
（2）你到底是要进公司做推荐系统方向？还是纯cv方向？还是NLP方向？还是语音方向？还是深度学习机器学习技术中台？还是硬件？还是前端开发？后端开发？测试开发？产品？人力？行政？这些你不可能啥都会，你需要找准一个方向，自己有积累，才能去投递，否则面试官跟你聊什么呢？
（3）今日推荐系统学习经验：IPNN和OPNN，用IPNN吧，PNN就是对FNN的改进，干掉FM，然后用LR+Product

猜你喜欢

node中的require
Java面向对象程序设计｜模拟生产者-消费者问题
格式化namenode时报错 No Route to Host from node1/192.168.1.111 to node3:8485 failed on socket timeout exception: java.net.NoRouteToHostException: No route to host
【hacker的错误集】解决写入csv出现乱码和空行问题
ubuntu16.04下安装wps
自定义微信小程序swiper轮播图面板指示点的样式
python 读取文件函数
Es编译源码
XVIII Open Cup named after E.V. Pankratiev. Grand Prix of Peterhof
男人

相关主题

Java IO系统
系统运维
系统安装
OA系统
系统角色表
清除系统缓存
09-排序1 排序
5.1 Linux系统
查看系统内核
Linux--系统调优
Linux系统IP地址
系统进程
Qt元对象系统
12栅格系统

zl程序教程

当前栏目

一文看懂推荐系统：排序14：PNN模型（Product-based Neural Networks），和FNN一个作者，干掉FM，加上LR+Product

一文看懂推荐系统：排序14：PNN模型（Product-based Neural Networks），和FNN一个作者，干掉FM，加上LR+Product

文章目录

一、动机

二、PNN模型细节

2.1 PNN模型整体结构

2.2 IPNN

2.3 OPNN

总结

相关文章