二维卷积中文微博情感分类项目
2023-06-13 09:17:15 时间
二维卷积中文微博情感分类项目
1、数据集说明
这里完成一个中文微博情感分类项目。这里我使用的数据集是从新浪微博收集的 12 万条数据,正负样本各一半。标签中 1 表示正面评论,0 表示负面评论。数据来源为https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/weibo_sen ti_100k/intro.ipynb。如果你有其他数据的话,也可以使用其他数据。 这一次我们使用的数据需要自己做处理,所以我们需要对句子进行分词,分词后再对每 个词根据频率来进行编号。这里我们要使用的分词工具是结巴分词,结巴分词是一个很好用 的中文分词工具,安装方式为打开命令提示符,然后输入命令:
pip install jieba
安装好以后在 python 程序中直接 import jieba 就可以使用了。
2、二维卷积中文情感分类实战
# 安装结巴分词<
相关文章
- Codeblocks中文乱码解决方法。[通俗易懂]
- codeblocks中文编码问题
- CINEMA 4D Studio R2023 for Mac(c4d超强三维动画设计)中文激活版
- OmniPlan Pro 4 for Mac(项目流程管理工具)中文
- 双向LSTM中文微博情感分类项目
- python3 库pandas写入csv格式文件出现中文乱码问题解决方法详解编程语言
- 翻译Linux命令:精通中文翻译(linux命令中文)
- MySQL导出中文乱码解决方法(mysql导出中文乱码)
- 25字中文文章标题:Linux 启动项目命令简介(linux启动项目命令)
- MySQL可视化工具:从零开始!(mysql可视化工具中文)
- MySQL中文字符无法存储问题解决方案(mysql不能存储汉子)
- Oracle汉语读音指南(oracle中文怎么读)
- 静态gb2312编码在项目传值出现中文乱码现象