NLP模型笔记2022-12:Deep Biaffine Attention for Neural Dependency Parsing【论文+源码】
2023-09-14 09:09:13 时间
Biaffine使用基于图的方法解析依存句法,对句中每次词找到head以及其到head的依存标签,因此针对图的依存句法解析需解决两个问题:
不定类别分类,哪两个节点连接弧?
固定类别分类,弧的标签是什么?
本文使用 双仿射分类器 分别预测依存关系(arc)和依存标签(label),在英语PTB数据集中0.957 UAS, 0.941 UAS,使之成为graph-based依存句法解析的基准模型,文中也介绍模型一些超参数对模型效果的影响。
Biaffine模型的以下特点:
使用双仿射注意力机制,而不是使用传统基于MLP注意力机制的单仿射分类器,或双线性分类器;
第一次尝试使用MLP对LSTM的输出进行降维,再输入至仿射层;
论文:https://arxiv.org/pdf/1611.01734.pdf
论文模型结构:
中文解释:
- https://www.hankcs.com/nlp/parsing/deep-biaffine-attention-for-neural-dependency-parsing.html
- https://blog.csdn.net/sinat_34072381/article/details/106864586
源码:
相关文章
- ESRGAN网络结构、论文和源码
- 【每周CV论文推荐】基于GAN的对抗攻击,适合阅读那些文章入门?
- 10万引大佬分享「写论文10大技巧」,连怎么沟通审稿人都提到了 | 科研党福利
- 论文速递2022.8.23!
- 论文速递2022.9.15!
- 数据分享|R语言对论文作者研究机构、知识单元地理空间数据可视化
- 大模型能自己「写」论文了,还带公式和参考文献,试用版已上线
- 来试试读论文的新神器!AMiner发布“论文背景文献”一键生成工具,帮你搞清一篇论文的“来龙去脉”
- [KDD 2022 | 论文简读] 用于复杂周期性时间序列预测的四元数Transformer
- [KDD 2022 | 论文简读] GraphMAE: 自监督的掩码图自动编码器
- 【重磅最新】ICLR2023顶会376篇深度强化学习论文得分出炉(376/4753,占比8%)
- 妇产科 | 最新发表的万篇论文大数据分析:40本SCI期刊投稿指南、研究热点等
- 十年来论文量激增,深度学习如何慢慢推开数学推理的门
- 再不报名就晚了!本周六,CVPR 2021线下论文分享会不见不散
- Raft论文读书笔记