zl程序教程

您现在的位置是:首页 >  IT要闻

当前栏目

DCGAN-论文阅读笔记(三)

2023-03-14 22:36:44 时间

隐空间分析


隐变量空间漫游

在latent space上walking,可以判断出模型是否是单纯在记住输入(如果生成图像过渡非常sharp),以及模式崩溃的方式

如果在latent space中walking导致生成图像的语义变化(例如添加或删除了对象),我们可以推断模型已经学习到了相关和有趣的表征


image


去除特定的对象

为了研究模型是如何对图像中的特定物体进行表征的,尝试从生成图像中把窗口进行移除

选出150个样本,手动标注了52个窗口的bounding box

在倒数第二层的conv layer features中,训练一个简单的逻辑回归模型,来判断一个feature activation是否在窗口中

使用这个模型,将所有值大于0的特征(总共200个),都从空间位置中移除


image


人脸样本上的矢量运算

vector(”King”) - vector(”Man”) +vector(”Woman”)的结果和向量Queen很接近

对单个样本进行操作的结果不是很稳定,而如果使用三个样本的平均值,结果就会好很多


image


总结展望


• 提出了一套更稳定的架构来训练生成对抗性网络

• 展示了对抗性网络可以很好的学习到图像的表征,并使用在监督学习和生成式的建模上

• 模式崩溃问题仍然存在

• 可以再延伸应用到其他领域,例如视频(做帧级的预测)和声频(用于语音合成的预训练特征)

• 可以对latent space进行更进一步的研究