您现在的位置是：首页 > 云平台

当前栏目

NLP-信息抽取-NER-2015-BiLSTM+CRF（三）：命名实体识别【实战】

识别实战信息命名 2015 NLP 实体抽取

2023-09-27 14:20:38 时间

一、项目步骤

1、读取数据集

数据集共三个文件，训练集，交叉测试集和测试集，文件中每一行包含两个元素，字和标识，每一句话间由一个空格隔开。

2、处理数据集

更新数据集中的标签【BIO转为BIOSE体系】

单独的： B-LOC→S-LOC;
两个的：B-LOC,I-LOC→B-LOC,E-LOC;
三个的：B-LOC,I-LOC,I-LOC→B-LOC, I-LOC, E-LOC;
…

给每个char和tag分配一个id，得到一个包含所有字的字典dict，以及char_to_id, id_to_char, tag_to_id, id_to_tag, 将其存在map.pkl中。

3、准备训练数据

将训练集中的每句话变成4个list；
第一个list是字，如[今，天，去，北，京]；
第二个list是char_to_id [3,5,6,8,9]；
第三个list是通过jieba分词得到的分词信息特征，如[1,3,0,1,3] （1，词的开始，2，词的中间&#

猜你喜欢

Matlab 摄像机标定+畸变校正
ASP.NET MVC Web API使用示例
EntityFramework Core映射关系详解
Maven的Mirror和Repository
大萨达所
（原）Ubuntu16中卸载并重新安装google的Protocol Buffers
使用webstorm+webpack构建简单入门级“HelloWorld”的应用&&构建使用jquery来实现
G20峰会的召开提升了杭州智慧城市的能力
《惢客创业日记》2019.01.02（周三）有一种修行叫还原这个世界
Redis缓存相关的几个问题
Linux ln（英文全拼：link files）命令是一个非常重要命令，它的功能是为某一个文件在另外一个位置建立一个同步的链接。
Microsoft.Bcl.Build.targets" cannot be imported again
关于计算机考级的那点事
Nagios设置只监控不报警
使 Asp.net Core Hosting Bundle 立即生效
kubernetes-event-exporter，轻松将 K8s 的 Event 导出到ES中
com.alibaba.dubbo.rpc.RpcException: Failed to invoke the method

相关主题

微表情识别
ie不识别
66课类型识别
点文字识别