块结构在文件中的表示IOB【转载】
文件 结构 转载 表示
2023-09-14 09:11:23 时间
转自:http://www.coderjie.com/blog/43b3601e0a2411e7841d00163e0c0e36
1.块在内存中以树的形式存储,分好块的文本在文件中用IOB标记存储:
I(inside,内部),O(outside,外部),B(begn,开始)。
如果一个单词被标记为B,则表示一个块的开始,块内的单词被标记为I,其他单词被标记为O。B和I标记后需要加块类型的后缀,如B-NP,I-NP。如下图所示:
文本方式的IOB格式存储如下:
We PRP B-NP saw VBD O the DT B-NP yellow JJ I-NP dog NN I-NP
conll2000语料库
NLTK中包含一个已经分好块的语料库conll2000,该语料库的部分内容如下:
http://nathanlvzs.github.io/Several-Tagging-Schemes-for-Sequential-Tagging.html
- IOB1: 标签I用于文本块中的字符,标签O用于文本块之外的字符,标签B用于在该文本块前面接续则一个同类型的文本块情况下的第一个字符。
- IOB2: 每个文本块都以标签B开始,除此之外,跟IOB1一样。
BIOES:
- START/END (也叫SBEIO、IOBES): 包含了全部的5种标签,文本块由单个字符组成的时候,使用S标签来表示,由一个以上的字符组成时,首字符总是使用B标签,尾字符总是使用E标签,中间的字符使用I标签。
相关文章
- ServletContext对象使用和文件下载案例
- Linux文件之strstr函数、将一个整数,结构体和结构体数组写进文件里
- ExcelVBA判断文件或文件夹是否存在
- postfix邮箱_用post方式发送文件
- windbg调试dump文件_dump是什么文件夹
- 【Android 逆向】Android 逆向基本概念 ( 软件运行时内存结构 | 文件与内存之间的联系 )
- 【C 语言】文件操作 ( 读取文件中的结构体数组 | feof 函数使用注意事项 )
- 【C 语言】文件操作 ( 学生管理系统 | 命令行接收数据填充结构体 | 结构体写出到文件中 | 查询文件中的结构体数据 )
- 【C 语言】文件操作 ( 配置文件读写 | 框架搭建 | 主函数逻辑结构 | 启动无限循环 | 接收用户操作值 | 宏定义 | 显示操作菜单 )
- parquet 文件解析
- 剪切Linux目录获取文件最佳结构(linux目录剪切)
- Linux构建快捷文件连接的方法(linux建立连接文件)
- php解析mpp文件中的前置任务详解编程语言
- C++文件读写结构体详解
- Linux下的删除文件权限设置指南(linux删除文件权限)
- Linux文件存储结构:层次分明的文件系统。(linux文件存储结构)
- windowsLinux为Windows共享文件的新方式(linux共享文件给)
- Linux下快速解压Jar文件(解压jarlinux)
- 系统Linux核心文件系统: 结构与功能(linuxcore文件)
- Linux分割文件的利器(linux把文件分割)
- Linux下的Jar文件替换策略(linuxjar替换)
- Linux文件系统中的分类结构(linux文件的类型)
- 妙用Linux CP命令快速合并文件(linuxcp合并)
- Oracle数据库表结构文件导入与导出(oracle表文件)
- 探索Linux文件结构的神奇世界(linux的文件结构)
- 掌握Linux文件拷贝:常用的5个拷贝命令(linux拷贝命令)
- 探究Oracle数据库的物理结构:从数据块到文件的一切(oracle的物理结构)
- 重新命名MySQL数据库文件的指南(mysql数据库文件名)
- 洞悉Linux文件系统的物理结构(linux文件的物理结构)
- 。Linux比较文件:快速精准的方法(linux 比较文件)
- MySQL中的FRM文件保存表结构的重要文件格式(mysql中frm文件)
- xml文件的结构解读
- 分享一个好东东,动态Include文件(DynamicFileIncludes)
- PHP编码规范之注释和文件结构说明