zl程序教程

您现在的位置是:首页 >  其他

当前栏目

NLP模型笔记2022-12:Deep Biaffine Attention for Neural Dependency Parsing【论文+源码】

论文源码笔记 for 模型 2022 12 NLP
2023-09-14 09:09:13 时间

Biaffine使用基于图的方法解析依存句法,对句中每次词找到head以及其到head的依存标签,因此针对图的依存句法解析需解决两个问题:

不定类别分类,哪两个节点连接弧?
固定类别分类,弧的标签是什么?
本文使用 双仿射分类器 分别预测依存关系(arc)和依存标签(label),在英语PTB数据集中0.957 UAS, 0.941 UAS,使之成为graph-based依存句法解析的基准模型,文中也介绍模型一些超参数对模型效果的影响。

Biaffine模型的以下特点:

使用双仿射注意力机制,而不是使用传统基于MLP注意力机制的单仿射分类器,或双线性分类器;
第一次尝试使用MLP对LSTM的输出进行降维,再输入至仿射层;

论文:https://arxiv.org/pdf/1611.01734.pdf
论文模型结构:
在这里插入图片描述

中文解释:

  • https://www.hankcs.com/nlp/parsing/deep-biaffine-attention-for-neural-dependency-parsing.html
  • https://blog.csdn.net/sinat_34072381/article/details/106864586

源码: