您现在的位置是：首页 > 其他

当前栏目

NLP-预训练模型-2019-NLU+NLG：T5【Transfer Text-to-Text Transformer】【将所有NLP任务都转化成Text-to-Text任务】【翻译、文本摘要..】

训练 to 模型所有任务文本 2019 Text

2023-09-27 14:20:38 时间

《原始论文：Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》
在这里插入图片描述

2019年10月，Google 在《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》这篇论文中提出了一个最新的预训练模型 T5（Text-To-Text Transfer Transformer），其参数量达到了 110 亿，完爆 Bert Large 模型，且在多项 NLP 任务中达到 SOTA 性能。有人说，这是一种将探索迁移学习能力边界的模型。

当然，最大的冲击还是财大气粗，bigger and bigger，但翻完它长达 34 页的论文，发现其中的分析无疑是诚意满满（都是钱）。类似这样的大型实验探索论文也有一些，首先提出一个通用框架，接着进行了各种比对实验，获得一套建议参数，最后得到一个很强的 baseline。而我们之后做这方面实验就能参考它的一套参数。

对于 T5 这篇论文，Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer，无疑也是类似的论文。它的意义不在烧了多少钱，也不在屠了多少榜（砸钱就能砸出来），其中 idea 创新也不大，它最重要作用是给整个 NLP 预训练

猜你喜欢

彩色的命令行 —— 使用 ANSI 色彩代码
[AWS] 03 - BATCH & ECS
linux下的缓存机制buffer、cache、swap - 运维总结 ["Cannot allocate memory"问题]
对企业来说，云端自行加密是可行之道吗？
屏蔽android的menu键，使menu键不能用，自定义menu键
数仓是如何与“夏令时”愉快的玩耍？
【Apollo学习笔记】—— Apollo8.0安装与测试
Linux - 理不清的权限chmod与chown区别
Entity Framework Code First约定
Arduino在串口监视器上输出字母表
一个简单搜索引擎的搭建过程（Solr+Nutch+Hadoop）
025正则表达式可视化工具
C语言进阶-文件操作超详解
如何安装最新的XFCE桌面？
精品spring boot+MySQL新冠物资管理系统vue
jeecg在controller中执行sql
线上一次简单的 JVM 调优，性能提升了15%
cmkae命令set_target_properties
Token登录认证知识

相关主题

入门训练（4）
c++ | 训练01
蓝桥杯训练5
蓝桥杯训练3
蓝桥杯训练1
算法训练 2的次幂表示
（原）torch的训练过程
pytorch训练模型
项目训练3

zl程序教程

当前栏目

NLP-预训练模型-2019-NLU+NLG：T5【Transfer Text-to-Text Transformer】【将所有NLP任务都转化成Text-to-Text任务】【翻译、文本摘要..】

相关文章

当前栏目

NLP-预训练模型-2019-NLU+NLG：T5【Transfer Text-to-Text Transformer】【将所有NLP任务都转化成Text-to-Text任务】【 翻译、文本摘要..】

相关文章

NLP-预训练模型-2019-NLU+NLG：T5【Transfer Text-to-Text Transformer】【将所有NLP任务都转化成Text-to-Text任务】【翻译、文本摘要..】