Item2vec 方法的特点和局限性
方法 特点 局限性
2023-09-11 14:17:12 时间
1. Item2vec 作为 Word2vec 模型的推广,理论上可以利用任何序列型数据生成物品的 Embedding 向量, 这大大拓展了 Word2vec 的应用场景。广义上的 Item2vec 模型其实是物品向量化方法的统称,它可以利用不同的深度学习网络结构对物品特征进行 Embedding 化。
2. Item2vec 方法也有其局限性,因为只能利用序列型数据,所以 Item2Vec 在处理互联网场景下大量的网络化数据时往往显得捉襟见肘,这就是 Graph Embedding 技术出现的动因
Graph Embedding – 引入更多结构信息的图嵌入技术
Item2vec 是建立在 “序列” 样本 (e.g. 用户行为序列) 的基础上的。而在互联网场景下,数据对象之间更多呈现的是图结构。典型的场景是由用户行为数据生成的物品关系图,以及由属性和实体组成的知识图谱 (Knowledge Graph)。在面对图结构时,传统的序列 Embedding 方法就显得力不从心了。在这样的背景下,Graph Embedding 成了新的研究方向,并逐渐在深度学习推荐系统领域流行起来。
Graph Embedding 是一种对图结构中的节点进行 Embedding 编码的方法。最终生成的节点 Embedding 向量一般包含图的结构信息及附近节点的局部相似性信息。
DeepWalk 的主要思想是在由物品组成的图结构上进行随机游走,产生大量物品序列,然后将这些物品序列作为训练样本输入 Word2vec 进行训练,得到物品的 Embedding。因此,DeepWalk 可以被看作连接序列 Embedding 和 Graph Embedding 的过渡方法。
相关文章
- 如何提醒客户重载父类的指定方法?
- 调用反射类的方法
- 设计模式之九(模版方法模式)
- 用pyenv管理Python多版本及下载加速方法--Mac上
- Linux下查看内存使用情况方法总结
- SHELL 002 -- ps命令常用方法
- tp5 中文排序失效解决方法convert(name USING gbk)
- Python语言学习:Python语言学习之容器(列表&元组&字典&集合)简介、特点/意义/经验总结及容器魔法方法(定义可变&不可变容器的协议)的简介、案例应用之详细攻略
- NLP之GPT-3:NLP领域没有最强,只有更强的模型—GPT-3的简介(本质、核心思想、意义、特点、优缺点、数据集、实际价值,模型强弱体现,开源探讨,GPT系列对比与总结)、安装、使用方法之详细攻略
- ML与Optimality:最优化理论(GD随机梯度下降/QN拟牛顿法/CG共轭梯度法/L-BFGS/TR置信域/GA遗传算法/SA模拟退火算法)在机器学习中的简介、常用方法、案例应用之详细攻略
- Python之pandas:pandas中数据处理常用函数(与空值相关/去重和替代)简介、具体案例、使用方法之详细攻略
- Android 10.0 SystemUI默认去掉底部导航栏的三种方法
- 实践Pytorch中的模型剪枝方法
- 教你几招HASH表查找的方法
- Python 这几种方法进行机器学习特征筛选,有效提升模型性能
- 最短路的解题方法差别
- Docker容器的使用方法
- 火影T7C笔记本Win11重装Win10系统方法分享
- C#开发的OpenRA游戏高性能内存访问的方法
- MySQL——修改root密码的4种方法(以windows为例)
- DL框架之AutoKeras框架:深度学习框架AutoKeras框架的简介、特点、安装、使用方法详细攻略
- tcpdump常用方法
- 【.Net实用方法总结】 整理并总结System.IO中StreamReader类及其方法介绍