谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
小明随意地涂鸦了一个头部,再简单地画了个翅膀,加上一个大尾巴……再单击「转换」键。
一只面目狰狞、皮肤粗糙、纹理细致的大怪兽就创造出来了。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s5.51cto.com/oss/202012/07/58c2d88c1559fc2378b70a326a8e2451.jpg)
这是Google研究人员制作的AI工具奇美拉画家(Chimera Painter)。
这是个线上绘画工具,可以将涂鸦变成一个栩栩如生的怪物。
奇美拉的条件型GAN
研究人员建立了一个生物混合体的概念,就像是一个纸牌游戏。
比如你拿到一张「鲸」卡,通过组合,可以变成一个「鲸VS大象」的嵌合体怪兽。
这个组合而成艺术作品,还能保留原始图像的视觉特征。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s2.51cto.com/oss/202012/07/903832d5996776178f3c5f2385f17278.jpg)
在此之前生成式对抗网络 (GAN, Generative Adversarial Networks )被广泛用于图像创作上。GAN一般包含两个模块:
- 生成模型(Generative Model)
- 判别模型(Discriminative Model)
两个模块互相博弈学习产生相当好的输出。一个优秀的GAN应用需要有良好的训练方法,否则可能由于神经网络模型的自由性而导致输出不理想。
例如,麻省理工学院和IBM合作,开发出了“GAN绘画工作室”。
允许用户上传自选图像以从多种角度修改其外观,从更改对象的大小到添加全新的物体,例如如树木、窗户、建筑物、桌子……等等。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s4.51cto.com/oss/202012/07/2391489eeecfbaffcc33df35c37cd184.jpg)
再有,英伟达(Nvidia)最新的AI软件将粗糙的涂鸦变成真实的风景。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s2.51cto.com/oss/202012/07/eae9d76113128ec15cd1a5f071577451.jpg)
而在奇美拉画家中,与前两者注重照片写实的GAN不一样,他们采用了一种称作条件型GAN的方法。
这种方法与一般的GAN不一样,一般的GAN是在一系列图片基础上,生成器和判别器相互对抗磨合,形成全新的图。
奇美拉画家则是需要在生成器中输入一张创作图,在此基础上,再通过GAN生成新图。
将怪兽肢解建模,再组合渲染
为了训练GAN,研究人员创建了10000多个全彩色图像的数据集,包含不同生物的3D模型。
在这个生物模型的数据库中,不仅描绘了每个生物整体的大小和形状,还提供了肢体、器官、躯干的分割图。
艺术家就在这些“肢解”模型的基础上,重新组合出新的“生物”。可以选择头、牙齿、躯干、翅膀等不同部分进行绘画。
可以看到左侧有各种肢体部分选项按钮。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s5.51cto.com/oss/202012/07/738198531b4de85a6c4bf758a6e4a9f1.jpg)
然后经过GAN,选出组合得最好的模型,将之合并,输出到Chimera Painter中。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s5.51cto.com/oss/202012/07/0e0d909d79270387687b77aa6905174f.jpg)
得先制作生物纹理
在GAN模型中,在渲染对比度低的图像部分时,会有跳格,使图像失去空间连贯性。
例如这张图的腿和眼睛的识别界限不清晰,导致输出来的图像奇奇怪怪。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s6.51cto.com/oss/202012/07/cd3656b34678de877dfda25ff3466eed.jpg)
为了解决这个问题,奇美拉画家的研究人员开发了一种新的半自动化方法。
奇美拉画家对每种所需的生物类型(例如鬣狗或狮子)都会建立一个模型。
然后,艺术家使用虚幻引擎制作了叠加在3D模型上的彩色纹理。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s4.51cto.com/oss/202012/07/b23971b93243bdc657fbe30ddc70f0af.jpg)
再将「分割图」的单色(例如头,耳,颈等部分)套用到模型上,确保GAN了解到艺术家指定的的结构,形状,纹理和比例。
![谷歌上线AI新玩法:随手乱涂鸦,一键变怪兽](https://s3.51cto.com/oss/202012/07/9ee22ea8b5416227c1f2ea72e59bac07.jpg)
再次使用虚幻引擎将3D生物模型放置在简单的3D场景中。
为了增加数据库的模型数量,一个自动化脚本会主动采用这个3D场景。在10000张生物模型的基础上,继续补充,生成了10000+张图像+分割图。
根据生物的不同姿势,在视点和缩放级别之间进行插值,创建出全色图像和分割图,形成GAN新的训练数据集。
而每次手动创建这些数据,需要20多分钟。
谷歌表示,奇美拉画家为艺术家节省了数百万小时的时间。
相关文章
- 中国移动3月5G套餐客户净增1559.3万,累计达1.88761亿户
- 自动化技术如何帮助招聘人员大规模识别合格人才
- 星火技术跻身“2020年度第四届IC独角兽”榜单
- 第四届中国IC独角兽榜单出炉
- Kubernetes诞生七周年后,优势与挑战并存
- AI押中高考作文题:科学、玄学还是炒作?
- 加拿大电信运营商Rogers大规模断网
- 为什么云计算永远不会吞噬数据中心
- 工信部:三大领域着手,推进适老化服务
- 人工智能重塑时装设计和生产
- 人工智能的未来是人机环境系统智能
- Reportlinker:到2026年,全球电信云市场规模将达523亿美元
- 报告:云投资的价值在哪里?
- 如果让 AI 来写高考作文,能得多少分?
- 博睿数据:服务可达的数据链DNA
- AI写了篇这样的高考作文:本手、妙手、俗手都属于手,抄手也属于手......
- AI再挑战高考作文 依托强大硬核科技实现“秒”写
- 我刚按下666,计算机发生了神奇的事情···
- 云计算供应商如何考虑中小型企业的需求
- 用更好的人工智能建设更美好的社会