Transformer课程 第8课NER案例代码笔记-IOB标记
2023-09-27 14:26:46 时间
Transformer课程 第8课NER案例代码笔记-IOB标记
NER Tags and IOB Format
训练集和测试集都是包含餐厅相关文本(主要是评论和查询)的单个文件,其中每个单词都有一个NER标记,将其指定为以下餐厅相关实体之一:
-
便利设施
-
烹饪
-
碟
-
小时
-
地方
-
价格
-
评级
-
餐厅名称
NER标记遵循一种在NER文献中广泛使用的特殊格式,称为IOB格式(内部、外部、开始格式)。该格式不仅为我们提供了标记实体的方法,还提供了指示哪些单词是同一实体的一部分的方法:
-
O:这个标签表示单词不是实体的一部分。
-
B:这个标签表示该单词是单个单词实体名称,或者是多单词实体名称中的第一个单词。
-
I:这个标签表示单词是多单词实体的一部分,但不是完整实体名称中的第一个单词。
看一个例子:
B和I标记在实体类型之前用作前缀,并且可以在您喜欢的任何实体类型之前使用,无论是人、餐馆还是国家。IOB格式有一些变体,可能对单个单词实体使用特殊标记,或对多单词实体中的最后一个单词使用标记。不同的格式可能会给不同类型的数据集带来一些优势。
相关文章
- HTML入门学习笔记+详细案例
- 数十种TensorFlow实现案例汇集:代码+笔记
- 波士顿房价预测——机器学习入门级案例
- 学习笔记8:《大型网站技术架构 核心原理与案例分析》之 固若金汤:网站的安全架构
- 学习笔记8:《大型网站技术架构 核心原理与案例分析》之 随需应变:网站的可扩展架构
- 学习笔记3:《大型网站技术架构 核心原理与案例分析》之 大型网站架构模式
- 大数据-Flume(三):案例、配置文件编写【案例①:netcat-->logger】【案例②:taildir-->hdfs】
- 开发心得-心得+案例
- 案例研究:在大型金融组织选择大数据和数据科学技术
- SQLite详解,案例,手册
- css案例学习之盒子模型
- Ulua_toLua_基本案例(四)_AccessingLuaVariables
- 白日梦的Elasticsearch实战笔记,ES账号免费借用、32个查询案例、15个聚合案例、7个查询优化技巧(一)
- 白日梦的Elasticsearch实战笔记,ES账号免费借用、32个查询案例、15个聚合案例、7个查询优化技巧。(一)
- 白日梦的Elasticsearch实战笔记,ES账号免费借用、32个查询案例、15个聚合案例、7个查询优化技巧。(三)
- Spark 2.2.1 SQL UDAF用户自定义函数案例
- 第7.11节 案例详解:Python类实例变量
- 案例分享|使用Unity 2D制作星球大战中BB-8
- Spring Boot 整合 Thymeleaf 完整 Web 案例
- Android Studio插件开发官网案例地址
- 大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
- .net 6简单使用NPOI 读取 Excel 案例+流程