Harvard NLP The Annotated Transformer 学习
学习 The NLP transformer
2023-09-27 14:26:47 时间
Harvard NLP The Annotated Transformer 复现Google公司的Transformer论文
“Attention is All You Need” 的Transformer 在过去的一年里一直在很多人的脑海中出现。Transformer在机器翻译质量上有重大改进,它还为许多其他NLP任务提供了一种新的体系结构。论文本身写得很清楚,但传统的看法是论文很难准确的去实现。在这篇文章中,Harvard NLP的原作者在2018年初以逐行实现的形式呈现了论文的“注释”版本,总共有400行代码,可以在4个GPU上每秒处理27000个标识。您首先需要安装PyTorch,notebook可以在Github或谷歌Colab(免费提供GPU)上使用。注意,这仅仅是研究人员和感兴趣的开发人员的起点。这里的代码主要基于Harvard NLP的OpenNMT包。对于模型的其他完整服务实现,请查看tensor2tensor(tensorflow)和Socketeye(mxnet)。
原作者:Alexander Rush (@harvardnlp or srush@seas.harvard.edu), with help from Vincent Nguyen and Guillaume Klein
预备工作:
# !pip install http:/
相关文章
- 机器学习基石第一讲:the learning problem
- 李宏毅机器学习_8卷积神经网络
- 鸿蒙系统学习 安全认证(二)
- DirectX 11游戏编程学习笔记之6: 第5章The Rendering Pipeline(渲染管线)
- 机器学习/人工智能的笔试面试题目——最优化问题相关问题总结
- Andrew Ng机器学习公开课笔记 -- Mixtures of Gaussians and the EM algorithm
- CSDN日报190801:如何高效学习正则表达式
- 学习网站/实用工具,收藏的快搜网站,想找什么都有!!!
- 【机器学习】目标检测
- php学习笔记2
- 『迷你教程』机器学习的中心极限定理及Python实现
- 使用 Python 机器学习的糖尿病预测模型
- Java学习-051-Detected both log4j-over-slf4j.jar AND bound slf4j-log4j12.jar on the class path, preempting StackOverflowError
- JSP框架基础学习
- [转]Redis学习---Redis高可用技术解决方案总结
- C#学习之一个经验教训
- 设计模式---观察者模式(学习笔记)
- Linux学习笔记(11)linux网络管理与配置之一——配置路由与默认网关,双网卡绑定(5-6)
- 低代码平台amis学习 二:写一个页面
- 机器学习实战读书笔记(2)决策树
- 深度学习 Day 5——解决深度学习中Numpy版本不兼容问题