zl程序教程

您现在的位置是:首页 >  其他

当前栏目

NLP-Pytorch-项目流程-案例(一):文本摘要【Seq2Seq(BiLSTM-LSTM)+ Attention】【预测算法:GreedySearch、BeamSearch】

2023-09-27 14:20:38 时间

在这里插入图片描述

一、数据预处理

1、原始数据

/data/raw_data/服饰_50k.json(共50000条数据)

{
	"1": {
		"title": "巴拉巴 拉 旗下 梦 多多 童装 男童 毛衫 冬季 中大童 毛衫 黑色",
		"kb": {
			"适用季节": "冬季",
			"厚度": "适中",
			"领型": "高领",
			"适用年龄": "9-12岁",
			"材质成分": "锦纶",
			"图案": "其它",
			"上市时间": "2018冬季",
			"面料": "其它",
			"风格": "休闲风",
			"衣门襟": "套头",
			"适用性别": "男",
			"安全等级": "B类",
			"毛线粗细": "普通毛线"
		},
		"ocr": "中国蓝,深土黄,健康安全,A门襟,黑色,衣袖&