腾讯“混元”AI大模型刷新CLUE分类榜历史记录
4月29日,腾讯“混元”AI大模型在CLUE(中文语言理解评测集合)分类榜中取得第一名,分数突破 80.888分,接近人类语言理解能力,刷新该榜单历史记录。
这是“混元”AI大模型在斩获跨模态检索榜单大满贯后,取得的又一突破性进展,展现了该模型在自然语言处理上的实力。
随着国内人工智能技术的不断发展,NLP(自然语言处理),即如何实现人类和计算机之间的语言交互,成为预训练模型的核心能力之一。当前,越来越多的企业和组织投入到该领域的研究当中,在各大AI榜单上的竞争也非常激烈。
作为中文最具权威的自然语言理解榜单之一,CLUE包括文本相似度、分类、自然语言理解、阅读理解等 9项任务, 涵盖搜索、广告、推荐等业务场景,对预训练模型的通用理解能力及知识迁移能力要求都很高。
腾讯“混元”技术团队模拟“人”的学习习惯,首次提出“课程学习”的训练方法,有效提升模型性能。具体来说,就是让模型进行从小到大、从易到难的“渐进式”学习。这种方式不仅使得模型通用性和复用性更好,还能有效缩减训练成本,让大模型更快地学会更多的知识。
此次登顶CLUE分类榜榜首,一方面代表了“混元”AI大模型在自然语言理解领域的实力得以验证,达到业内领先水平;另一方面也预示着混元正在通过技术创新实现更为全面的能力,能够为行业应用和学术研究带来更多长期价值。
据了解,“混元”AI大模型同时具备自然语言理解、计算机视觉、多模态内容理解、文案生成、视觉生成等能力。同时,借助腾讯太极机器学习平台的GPU算力和训练加速框架,“混元”实现了稳定、高效的模型迭代。
目前,“混元“AI 大模型已经广泛应用于腾讯微信搜索、腾讯广告等业务场景,提升了搜索体验和广告推荐精准度。未来,随着研究的进一步完善和业务实践的不断深入,“混元”AI大模型将赋能更多业务场景,帮助精准理解用户需求,更好地服务用户。
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击