论文阅读《Joint Extraction of Entities and Relations Based on a Novel Decompostion Strategy》
前言
- 文章来源:LawsonAbs(CSDN)
- 望各位读者审慎阅读
1.之前的问题
因为之前的信息抽取模型使用的方法是先抽取再分类,或者是一个联合标注的方法,这些方法存在的问题就是:在抽取实体和关系的时候忽略了内部的结构;同时也会有产生大量的冗余的实体对。
2.解决办法
- 将联合抽取任务分解成两个子任务:HE extraction 和 TER extraction。第一个子任务是为了抽取所有可能存在关系对的头实体;第二个子任务是为了抽取在第一个任务得到的头实体对应的尾实体和关系。
那么具体该怎么做上面这两个任务呢?具体的方法就是:
- 使用作者提出的
span-based tagging scheme
,将这两个任务分解成数个序列标注来完成
原话是这么说的:
Next, these two subtasks are further deconstructed into several sequence labeling problems based on our proposed span-based tagging scheme, which are conveniently solved by a hierarchical boundary tagger and a multi-span decoding algorithm.
这里的意思就是:这两个任务都可以通过一个hierarchical boundary tagger and a mulit-span docding algorithm
解决。
3. 解码算法
接下来聊聊整个模型的解码算法。
其实我之前是对解码算法不怎么理解的,因为我一直觉得:有什么样的tagging方式, 就对应什么样的解码操作不就行了吗?难道还要专门写一个解码算法吗?对,还需要专门写个解码算法,因为复杂的编码结构就必须对应一个简要的解码方式,否则就是一篇不充分的论文。以编码的方式去解码这个想法应该是正确的,这篇文章也以伪代码的方式给出了解码的方式,如下所示:
这里的解码部分主要是13 - 20行,其主要的思想就是:按照最近邻匹配的方式解码。
4.问题
4.1 a novel decomposition strategy
中的 novel
体现在什么地方?
这里的novel 修饰的是decomposition,说明的问题就是: 分解的方式很novel,因为这里分成了两部分,第一部分是 head entity
的抽取,第二部分是end entity
+ relation
的抽取。
4.2 为什么要 decompostion
? decomposition
能带来什么?
为了噱头
4.2 怎么做到“范式不再在第一步提取所有实体,只识别可能参与目标三元组的头实体”?
4.3 文章中说的hierarchical boundary tagger
是什么?
先找出文中的提及到的几处 hierarchical
To enhance the association between boundary positions, we present a hierarchical boundary tagger, which labels the start and end positions separately in a cascade structure and decode them together by a multi-span decoding algorithm.
the hierarchical boundary tagger, which is the basic labeling module in our method.
According to our tagging scheme, we utilize a unified architecture to extract HE and TER. In this paper, we wrap such extractor into a general module named hierarchical boundary tagger (abbreviated as HBT).
Such decomposition indicates that there is a natural order among the tasks: predicting end positions may benefit from the prediction results of start positions, which motivates us to employ a hierarchical tagging structure.
这句话读着有点儿难受,识别头实体的end难道竟然可以从头实体的start中受益?
下面来看一下HBT
的基本结构图:
根据上图可以看出,这个模型是存在一个层级,所以叫做hierarchical
。同时可以看到这里的 Start Tags
的标注结果会传到End Tags
模块中使用。
相关文章
- 【论文笔记】Multi-Domain Dialogue State Tracking based on State Graph
- Install KDE Plasma and XRDP on Ubuntu Server
- Dinky on k8s 整库同步实践
- ORA-38883: Cannot shrink data file string on primary database due to guaranteed restore points. ORACLE 报错 故障修复 远程处理
- ORA-47401: Realm violation for string on string.string ORACLE 报错 故障修复 远程处理
- MySQL Error number: MY-011654; Symbol: ER_GRP_RPL_APPLIER_TERMINATION_TIMED_OUT_ON_SHUTDOWN; SQLSTATE: HY000 报错 故障修复 远程处理
- ORA-14461: cannot REUSE STORAGE on a temporary table TRUNCATE ORACLE 报错 故障修复 远程处理
- ORA-16813: log apply service not running on apply instance string recorded by the broker ORACLE 报错 故障修复 远程处理
- linux中安装eclipse,安装好之后不能直接建servlet,不能直接在jsp页面中run on server.权限在作怪,我猜的,详解编程语言
- 理想ONE座椅水银门大续集!主驾座椅拆下也有水银
- MySQL连接查询:活学活用ON条件(mysql连接查询on)
- Come on ! 手把手教你玩转谷歌TensorFlow | 雷锋网公开课
- Redis On the Rise: Understanding the Benefits of This InMemory Database Solution(redison)
- How to troubleshoot delay issues on Linux systems(linuxdelay)
- 深入MySQL解密On语句的使用方法(mysql中on使用方法)
- Oracle中ON关键字的精彩运用(oracle中on的使用)
- Oracle中妙用ON子句优化SQL查询(oracle on子句)