zl程序教程

您现在的位置是:首页 >  其他

当前栏目

浅聊一下 AI 画画

2023-03-07 09:12:18 时间

1、AI 画画爆火

2022 年 8 月,在美国科罗拉多州举办了一场新兴数字艺术家竞赛,其中『数字艺术/数字修饰照片』类别的一等奖由一幅名为《太空歌剧院》的作品获得,而神奇的是这幅作品的参赛者并没有绘画基础,而是完全用 AI 完成了这幅作品。这一事件引发了热议,并由此激发了大家对 AI 画画的兴趣。

AI 绘画作品《太空歌剧院》

随后,AI 画画的黑科技:文本描述自动生成图片(Text-to-Image)变成科技媒体频频报道的当红炸子鸡,甚至由此诞生了一个新名词:AIGC(AI Generated Content),并把 2022 年称为 AIGC 元年。

2、平台介绍

目前,AI 画画平台如雨后春笋,很多厂商都推出自己的 AI 画画平台。这里我们就简单介绍几个:

1)Stable Diffusion

Stable Diffusion 是 Stability AI 公司在 2022 年发布的深度学习文生图模型,它主要用于根据文本的描述产生详细图像,它也可以应用于其他任务。该平台一经推出就因为免费、生成速度快(一般不到 30s)受到了广大网友的喜爱。

此外,Stable Diffusion 已经开源了代码和模型权重,可以在大多数配备有适度 GPU 的电脑硬件上运行。所以现在很多公司都在根据他们的代码,来开发自己的 AI 绘画产品。他们的口号是:『AI by the people, for the people』。

2)Dall-E2

Dall-E 是 OpenAI 这家 AI 公司发布的支持文本生成图像的模型,OpenAI 的创始人之一就是我们熟悉的马斯克。

2022 年 4 月,OpenAI 宣布了新版本的 DALL-E 2,声称它可以从文本描述中生成照片般逼真的图像,另外还有一个允许对输出进行简单修改的编辑器。如图所示:

DALL-E 2

DALL-E 2

3)Midjourney

Midjourney 目前是架设在 Discord 频道上的 AI 工具,因此需要注册 Discord 帐号才能使用。

使用方法也很简单,进入 Midjourney 的 Discord 频道,在频道对话框输入 /imagine + 关键词,系统就会在对话框里发送生成的图。值得注意的是,系统出的图全频道可见,部分网友会选择付费隐私订阅。

下图是 Midjourney 输出的英雄联盟金克丝的真人形象:

金克丝

咒语:jinx from league of legends as a real person, realistic, 8k

Midjourney 也是开头提到《太空歌剧院》的创作平台。

4)文心一格

国内百度也推出了自己的 AI 画画产品:文心一格。平均出图时间在 2s 内,文心最大的优点在于理解中国文化,尤其擅长古风和水墨画。

下图是诗句『相看两不厌,只有敬亭山』输出的中国风画作。

相看两不厌,只有敬亭山

相信这是国外的 AI 平台很难理解的文化内涵,感兴趣的同学可以试试。

3、Stable Diffusion 操作实践

接下来选择我最喜欢的平台 Stable Diffusion 进行简单操作实践:

1)官网注册账号

打开官网:https://beta.dreamstudio.ai/dream,选择喜欢的注册方式完成注册。

Stable Diffusion

2)开始画画

登陆后我们看到的是这样的界面。其中,底部输入框可以输入关键词,右边工具栏可以修改配置。

Stable Diffusion

系统已经提供了一个默认咒语:A dream of a distant galaxy, by Caspar David Friedrich, matte painting trending on artstation HQ

点击 Dream 即可生成一张浪漫主义的银河画作。

Stable Diffusion

鼠标放在图片中间可免费下载。

如果我想换种风格怎么办,我想画一张梵高风格的银河,修改咒语即可:A dream of a distant galaxy, by Vincent Willem van Gogh, matte painting trending on artstation HQ

Stable Diffusion

或者我不想画星空,我想画一个小姐姐,同样修改咒语:A dream of a pretty girl, by Caspar David Friedrich, matte painting trending on artstation HQ

Stable Diffusion

对目前的 AI 画画来说,咒语的调教可谓重中之重,画作质量全靠咒语有没有选好。

原则上越精准越好,AI 不会违抗你的指令,但会对你没有明确的部分做一些猜测,只是很多时候并不如人所愿。这也要求用户不要输入一些自相矛盾的词。

推荐一个翻译网站:https://www.deepl.com/translator。如果你想把关键词翻译成英文,这个网站翻译出来的结果 AI 会更好理解。

3)修改设置

我们可以修改下面这些设置:

Stable Diffusion

  • Width/Height:生成图像尺寸
  • Cfg Scale:生成图像和咒语贴近的程度
  • Steps:数值越高质量越好,耗时越久
  • Numbers of Images:一次生成几张图像
  • Sampler:采样器
  • Model:模型版本
  • Seed:随机种子
  • Image:如果输入底图,AI 会参考底图来画图。但 AI 未必会参考底图的构图和风格,而是会识别底图中的元素,把它转化为关键词,生成图片。所以很多时候生成的图片和底图并不相像,了解原理后就好理解了。

小结

不同的 AI 画画平台的技术实现会有差异,其核心能力都是输入巨量训练集,把人类画作转换为抽象的数学向量表示,再通过反向转换,用 AI 来创作新的作品。目前比较火的模型就是 Stable diffusion,因为开源、效果也好。

篇幅所限,我们今天的 AI 画画就浅试一下。如果大家喜欢,在后续的文章中我们会继续介绍 AI 画画的算法原理。