谷歌发布最新版 AI 系统,图像配文准确率高达 93.9%
2023-06-13 09:16:04 时间
近日,谷歌发布了最新版机器学习系统,通过识别图像中的内容,配上对应文字,效果达到了历史最佳。谷歌已经在 TensorFlow 上开源了这项成果。自 2014 年以来,谷歌一直致力于这个项目,现在这个算法描述图像的准确率已经高达 93.9% 。
因为他们正在使用一个使用一个开始架构的最新的迭代,所以对于谷歌团队来说,有个大问题是该算法是否可以做的比简单识别图像中的对象更多。要真正解释和描述一张照片,人工智能不仅需要了解图片中是什么,更要了解图像中这些对象有什么相互关系。谷歌的开发人员表示这不只是一个数据的倒推。该算法必须能够自然地理解图像中的对象和它们的用途。
谷歌研究的博客发文说:“令人兴奋的是,在展示全新情境时,我们的模型的确可以产生准确的配文,这显示出系统对图像中目标和背景的理解更深了。”同样重要的是,“它还学会了如何表示知识在自然的英语短语,尽管它只读了人类给的说明字幕,没有在接受其他额外的训练。”
至少从目前来说,相对于视频,机器学习算法能更好地理解静止图像的内容。
via Google Research Blog
推荐阅读:
洪小文独家解读: 直到AI可以自己编程 它才有资格跟 “路人甲” 比智能
雷锋网原创文章,未经授权禁止转载。详情见转载须知。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/61061.html
aliyungoogleiPhonePhone人工智能开源谷歌相关文章
- 面向地球系统可预报性的AI白皮书
- Mac中文版Ai矢量图设计软件:Illustrator 2022
- 鄂维南院士:AI for Science,一场发生在当下的科技革命
- 小哥自创AI防拖延系统,一玩手机就被“闪瞎” | Reddit高热
- AI催生算力供给侧变革
- 基于AI算法的数据库异常监测系统的设计与实现
- 加油站AI智能视频监控分析系统
- 存算一体——后摩尔时代的AI芯片架构[通俗易懂]
- 世界首个!Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成
- 检修盒面板AI视觉检测系统,赋能工业发展!
- AI动作异常行为分析监测系统
- 新思科技DSO.ai助力客户完成100次流片,引领AI在芯片设计中的规模化应用
- 在AI消灭宫颈癌这件事情上,腾讯天衍实验室做了一些重磅研究
- AI总监Karpathy亲自揭秘特斯拉纯视觉系统,还有自动驾驶超算Dojo原型
- AI软件下载,Adobe ai设计软件中文版 win/mac电脑版下载安装教程
- 无线系统复杂性增加,AI 成克服挑战的关键
- AI无人驾驶工程师是怎么练成详解程序员
- AI可创作与人类画作“难以分别”的艺术品
- 首个获FDA批准的AI辅助心脏成像系统,是如何诞生的?
- 儿童语音引擎识别准确率达95%,葡萄英语如何让AI老师更懂孩子?
- 设计时间缩短10倍,PPA提升20%,AI终于要革新芯片设计了
- 辩论:智能投顾是否真AI ?这么厉害怎么不自己用而要开放出来?| CCF-GAIR 2017
- 如何在SQL Server中利用AI优化数据库管理(sqlserver ai)
- MySQL中AI的含义简介(mysql中ai的意思)
- 使用教程As an AI language model I cannot determine the specific context of the text without more information Please provide more context or a specific request
- 王强:AI金融伪场景众多,为何应重仓三维视觉与开放金融平台? | CCF-GAIR 2019
- 发6款AI新品,小米深化大家电布局