zl程序教程

您现在的位置是:首页 >  其他

当前栏目

AI比赛-推荐系统(一)-新闻推荐02:训练item词向量【每篇新闻文章对应一个词向量】【word2vec:将每个用户点击的新闻文章序列作为输入(类似文本序列),训练出每篇文章的向量表示】【天池】

训练序列输入AI系统 一个 用户 推荐
2023-09-27 14:20:38 时间

安装gensim,使用gensim中的word2vec模型

 

# 安装gensim
!pip install gensim
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt
from gensim.models import Word2Vec
import logging

一、读取原始数据

1、加载原始数据 

path = './data_raw/'
save_path = './temp_results/'

2、读取训练数据集 

# 训练数据集
trn_click = pd.read_csv(path + 'train_click_log.csv')
trn_click = trn_click.sort_values('user_id')
trn_click
user_id click_article_id click_timestamp click_environment click_deviceGroup click_os click_country click_region click_referrer_type