AI去除马赛克,可还行?
哈喽,大家好。
你有没有想过用 AI 技术去除马赛克?
仔细想想这个问题还挺难的,因为我们之前使用的 AI 技术,不管是人脸识别还是OCR识别,起码人工能识别出来。但如果给你一张打上马赛克的图片,你能把它复原吗?
显然是很难的。如果人都无法复原,又怎能教会计算机去复原呢?
还记得前几天我写的一篇《用AI生成头像》文章吗。在那篇文章中,我们训练了一个DCGAN模型,它可以从任意随机数生成一个图像。
随机数作为像素生成的噪声图
模型从随机数生成正常头像
DCGAN包含生成器模型和判别器模型两个模型组成,生成器模型的作用是从一组随机数生成一个图片,图片与训练样本越接近越好,从而骗过判别器模型,而判别器模型则要不断提高鉴别能力,防止生成器模型生成的图片蒙混过关。
如果我们把上述生成器模型的输入由随机数改成带有马赛克的图片,输出则是不带马赛克的图片。是不是就可以训练出一个去除马赛克的模型了。
接下来,跟大家分享下如何训练去除马赛克模型,然后再分享一个现成的工具,大家可以下载下来直接用,试试效果。
1. Pix2pix + CycleGAN
这里我们不用上面介绍的DCGAN,而是用Pix2pix和CycleGAN两个更强大的模型,分别来训练。
Pix2pix是基于GAN的图像翻译算法,从马赛克图片到正常图片,本质上跟一种语言到另一种语言的转换类似,都是翻译的过程。
Pix2pix模型翻译
而CycleGAN的实现的效果,简单来说就是将不同域之间的图像进行转换,而本身的形状保持不变。
CycleGAN模型
文章为我们提供了数据集和完整的训练过程,能够帮助我们以较低的成本训练模型。
首先,下载数据集
数据集
共 654M。
然后,下载Paddle预训练模型
预训练模型
最后,分别训练Pix2pix和CycleGAN模型。
Pix2pix 模型
python gan/infer.py
--init_model output/pix2pix/checkpoints/110/
--dataset_dir /home/aistudio/
--image_size 256
--n_samples 1
--crop_size 256
--model_net Pix2pix
--net_G unet_256
--test_list /home/aistudio/test_list.txt
--output ./infer_result/pix2pix/
CycleGAN 模型
python gan/infer.py
--init_model output/cyclegan/checkpoints/48/
--dataset_dir /home/aistudio/
--image_size 256
--n_samples 1
--crop_size 256
--input_style A
--test_list /home/aistudio/test_list.txt
--model_net CycleGAN
--net_G resnet_9block
--g_base_dims 32
--output ./infer_result/cyclegan/
训练完后,大家可以运行gan/infer.py文件,对比这两种模型去除马赛克的效果。
2. 现成工具
如果你不想自己训练模型,这里给大家分享现成的项目,它也是基于语义分割以及图像翻译,参考了Pix2pix和CycleGAN。
项目地址:https://github.com/HypoX64/DeepMosaics/blob/master/README_CN.md
对于Windows用户,作者提供了包含GUI界面的免安装软件包。
UI界面
前面我们说过,这种技术还是比较难的,所以大家不要有太高预期。这里发下实际的去除效果。
打码
去码
效果还是可以的,只不过没有想象中那么完美,大家可以下载运行试试。
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击