GAN作用——在我做安全的看来,就是做数据拟合、数据增强
2023-09-14 09:11:52 时间
from:https://www.zhihu.com/question/56171002/answer/155777359
GAN的作用,也就是为什么GAN会火了(有部分原因可能是因为Lecun的赞赏)。如果GAN只是用来生成一些像真是数据一样的数据的话,那不会有像现在这么火。更多的,或者对于机器学习研究员来说,看待的最关键一点应该是GAN可以用来 拟合数据分布 。什么叫拟合数据分布,就是给你一个训练数据,你能通过GAN这个工具,产生和这个数据分布相似的一些数据。有了拟合数据分布的思想,并在这上面做文章,才是一个真正的机器学习研究人员的素质。比如WGAN,也就是考虑到了GAN是一种拟合数据分布的工具,那么它可能和一些拟合数据分布的函数比如KL散度等是等价的,那么作者朝这个方向进行探索,自然能得出相应的结论,并且提出改进办法,使其成为风靡一时的工作。其实,可以做的工作还有很多,比如,既然你有一个产生类似数据的工具,那么其实你就有了一个做数据增强的工具,也就是对于你的神经网络来说,你有更多的训练数据了。很多人可能会觉得这个想法很简单,其实并不然。因为GAN本身用神经网络训练,如果你能把它融入你的一个任务当中,只用加一些损失函数,其实就能提高你任务上的性能,而且很多人还会觉得你性能好是因为加了神奇的损失函数,其实不过是用GAN做了一些隐式的数据增强吧了。但是你可以随便吹自己的模型是多么厉害,损失函数设计得多么有意义,多绕几下,别人也就忘了不就是GAN增强了数据嘛。因为GAN给各个任务开了一条提高性能的大门,那每把GAN用在一个任务上,就得引用GAN这篇论文,引用量上去了自然就火了。而且原始GAN是难训练或者效果差的,那么这些嗷嗷待哺的任务和相关研究人员自然也会更多关注GAN的发展,以期望在自己的任务上用到最新,最好的技术。所以,最近做提高和改进GAN的工作也取得了极大的关注度。那么再解释一下这个工作变火的本质:以前的神经网络存在生成困难的问题,GAN提供了解决办法,该方法简单、强大、适用性广。
相关文章
- web安全之点击劫持
- 传智播客c/c++公开课学习笔记--C语言与木马恶意代码分析和360安全防护揭秘
- 当 Kubernetes 遇到机密计算,阿里巴巴如何保护容器内数据的安全?
- 阿里巴巴副总裁肖力:云原生安全下看企业新边界——身份管理
- java安全删除一个文件,防止工具恢复数据
- 登陆安全过滤器
- PHP 源码探秘 - 线程安全的实现原理
- Java设计模式--使用内部类实现线程安全且懒加载的单例模式
- Atitit 安全登录退出管理法v3 tbb.docx 目录 1.1. 未持有效出入边界票据。。校验票据有效性1 1.2. 从事与票据种类不符的活动的2 1.3. 数据为数字的应该校验数字2
- Android安全开发之浅谈网页打开APP
- 【2016阿里安全峰会】秘在其中:做好数据与信息的安全管理【附PDF下载】
- Database之SQLSever:数据库管理人员国家职业资格证书中高级考试知识点(流式文件/封锁机制/三级模式(模式/内模式/外模式)/事务及其ACID特性/数据依赖/数据库的特点/安全/层次-网状
- 4步教你做一个煤气安全提示神器
- 网络货运平台要智能,安全的数据底座少不了
- 数据加密:你应该知道的数仓安全
- 如何保障企业数据资产的全生命周期安全?看这篇就够了
- 数据脱敏:数仓安全隐私保护见真招儿
- IE安全限制
- 安全数据集汇总——from安全学术圈 https://secdr.org/
- http://www.secrepo.com 安全相关的数据获取源
- 通过Hadoop安全部署经验总结,开发出以下十大建议,以确保大型和复杂多样环境下的数据信息安全。
- 企业级大数据的安全方案 & Kerberos 的 expire 及 renew说明
- 【日常工作所需,零锁整理二】关于Absolute公司防盗追踪软件会向境外传输不明数据等安全风险:撰写了批处理脚本