研究发现,人工智能语言模型 GPT-3 在智商测试中明显胜过人类大学生
1 月 9 日消息,2020 年 6 月,在训练约 2000 亿个单词、烧掉几千万美元后,史上最强大 AI 模型“生成型已训练变换模型 3”(GPT-3)一炮而红。
这个 OpenAI 打造的语言 AI 模型宛如万能选手,只有你想不到的画风,没有它输不出的文案,既能创作文学,能当翻译,还能编写自己的计算机代码。任何外行人都可以使用这一模型,几分钟内提供示例,就能获得想要的文本产出。
据新华社,美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡量智力的一系列推理测试中,自回归语言模型 GPT-3 的成绩明显优于普通大学生。
该程序利用深度学习生成类似人类语言的文本。GPT-3 有很多用途,包括语言翻译和为聊天机器人生成文本等,其有 1750 亿个参数,是目前规模最大、功能最强的语言处理人工智能模型之一。
IT之家这里突然想到,OpenAI 的 ChatGPT 似乎也实现了类似效果,虽然它依然基于 GGPT-3,但这一模型被业内称为“GPT-4” ,这也是硅谷研究实验室推出的第四代语言模型,对全世界的搜索引擎、作家、编码人员、教授以及 Nickelback 构成了生存威胁。
当然,根据大多数专家的意见,与即将发布的 GPT-4 主版本相比,ChatGPT 现版本只能说是一个开胃小菜。
加州大学研究者认为,这类大型语言模型重新引发了关于在提供足够训练数据的情况下人类认知能力是否更强的争论。特别令人感兴趣的是这些模型能够零样本地推理新问题,而无需对这些问题进行任何直接训练。
研究人员指出,在人类认知中,这种能力与类比推理能力密切相关,而他们在一系列类比任务上对 GPT-3 进行了直接比较,包括与 Raven 的渐进矩阵密切相关的新型基于文本的矩阵推理任务,最终发现 GPT-3 表现出了惊人的抽象模式归纳能力,在大多数情况下匹配甚至超越人类的能力。
最终结果表明,诸如 GPT-3 之类的大型语言模型已经获得了一种“新兴能力”,可以为广泛的类比问题找到零样本解决方案。
参考资料:
https://doi.org/10.48550/arXiv.2212.09196
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击