OpenAI开放GPT-3微调功能,一行命令就能实现!正确率最高提升四倍
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
OpenAI刚刚宣布,允许用户创建自定义版的GPT-3。
而且步骤非常简单,只需一行命令就能实现!
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s3.51cto.com/oss/202112/15/ddf1e5275356350d36da0af26f75592c.jpg)
经过微调(fine-tuned),定制版的GPT-3在不同应用中的提升非常明显。
OpenAI表示,它可以让不同应用的准确度能直接从83%提升到95%、错误率可降低50%。
解小学数学题目的正确率也能提高2-4倍。
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s6.51cto.com/oss/202112/15/8c662f3c0ac9000e60a773ca1b94e2eb.jpg)
这样一来,踩在巨人的肩膀上、直接在1750亿参数的大模型上微调,不少研发人员都可以不用再重头训练自己的AI模型了。
这让网友们大呼:
现在我能直接训练我的聊天机器人了,这可节省太多时间和费用了!
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s6.51cto.com/oss/202112/15/fb34c07a135564e6dd62f36262441ef2.jpg)
比如这个税收应用——Keeper Tax。
显然,在把GPT-3开放给更多人用这件事上,OpenAI真的是不遗余力。
微调好处多
微调好处多,这一点OpenAI早有证明。
今年6月,他们就曾只用80个文本的数据集进行训练,让GPT-3说话的危险性大幅降低,而且表达也更有人情味。
(下图中蓝线表示训练后模型,红线表示基础模型,分数越高意味着表现越好)
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s4.51cto.com/oss/202112/15/f6ec31d3c946da8b8bc197611673bdc2.jpg)
事实上,已经有不少应用已经用上了定制版的GPT-3,并且表现都不错。
比如这个税收应用——Keeper Tax。
它能通过定制版的GPT-3来识别账单上的各种数据,以帮助用户找到可以免税的费用。
Keeper Tax表示,在用上微调后的GPT-3后,应用识别的准确率每周都会提高约1%,准确率已经从过去的85%提升到了93%。
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s2.51cto.com/oss/202112/15/f6abf6f7115be6d4db3c522473e3cdfc.jpg)
再来看这个人工智能检索工具——Elicit。
它可以根据用户搜索的问题来智能给出结果。
在用上定制版GPT-3后,Elicit给出的结果在易懂性上提高了24%、准确性上提高了17%、整体方面则提升了33%。
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s6.51cto.com/oss/202112/15/a8c20b66859b3777c421b6d3222fe6b5.jpg)
还有这个可智能读取用户评论的应用——Viable。
它能够从大量评论中读取用户的重要建议,比如投诉、疑问等。
定制化GPT-3使该应用在识别用户反馈的准确率上从66%提升到了90%。
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s5.51cto.com/oss/202112/15/b62fd40da54f5e5686f075468749865a.jpg)
事实上,不只是准确率上的提升。
在输出结果的用时、多样性上,定制化GPT-3都有着更明显的优势。
如何食用?
OpenAI表示,想要微调GPT-3大致需要3个步骤:
准备和上传训练数据;训练微调模型;最后使用。
其中,训练数据必须是JSONL文档,这一步是让GPT-3在哪方面表现突出的关键。
创建微调模型是在OpenAI CLI上进行,步骤也很简单,只需上传数据文件、创建微调作业、再等待几分钟或几小时等待作业完成。
最后,使用微调模型时,只需将命令行中fine_tuned_model字段换成模型名称即可。
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s4.51cto.com/oss/202112/15/7d37bfa975cb0fc72027aa94c0f75f43.jpg)
具体步骤OpenAI已在官方网页上给出,可参看文末链接2。
当然,想要用更加强大的GPT-3,所需费用也会有些提升。
微调后模型每1K token的费用,将比基础版高出50%。
OpenAI技术人员在采访时表示:“我们开发此功能时,希望能够让没有AI研究背景的人也能使用它。
不少网友也纷纷留言表示,自己用GPT-3写出了很多有意思的应用。
比如有人就写了一个睡眠播客,可以讲童话故事的那种:
![OpenAI开放GPT-3微调功能,一行命令就能实现!正确率<span><span><span><i style=](https://s4.51cto.com/oss/202112/15/0995a5b11f422c302f72a6de2743d709.jpg)
相关文章
- 一篇运维老司机的大数据平台监控宝典(2)-联通大数据集群平台监控体系详解
- 一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解
- 空中换引擎 博时基金数字化转型经验谈
- 如何高效地学习编程语言
- 作为一名阿里巴巴数据分析大牛,送给学弟学妹的经验积分
- 为什么要学习R语言
- Hadoop大数据分析平台的介绍性讨论
- 最全面的Spring学习笔记
- 16个用于数据科学和机器学习的顶级平台
- 给有抱负的数据科学家的六条建议
- 如何做一枚合格的数据产品经理
- 除Kaggle外,还有哪些顶级数据科学竞赛平台
- 一个鲜为人知却可以保护隐私的训练方法:联合学习
- 干货 :送你12个关于数据科学学习的关键提示(附链接)
- 大数据行业有多少种工作岗位,各自的技能需求是什么?
- 中国移动研究院常耀斌:商用大数据平台的研发之路
- 这些数据科学家必备的技能,你拥有哪些?
- 自学成才的开发者有何优势和劣势?
- Gartner报告:正处于数据科学与机器学习工具 “大爆炸”的时代
- Ready Computing借助InterSystems IRIS医疗版为医疗机构提供具有高度互操作性和可扩展性的解决方案