from:https://www.zhihu.com/question/56171002/answer/155777359

GAN的作用,也就是为什么GAN会火了(有部分原因可能是因为Lecun的赞赏)。如果GAN只是用来生成一些像真是数据一样的数据的话,那不会有像现在这么火。更多的,或者对于机器学习研究员来说,看待的最关键一点应该是GAN可以用来 拟合数据分布 。什么叫拟合数据分布,就是给你一个训练数据,你能通过GAN这个工具,产生和这个数据分布相似的一些数据。有了拟合数据分布的思想,并在这上面做文章,才是一个真正的机器学习研究人员的素质。比如WGAN,也就是考虑到了GAN是一种拟合数据分布的工具,那么它可能和一些拟合数据分布的函数比如KL散度等是等价的,那么作者朝这个方向进行探索,自然能得出相应的结论,并且提出改进办法,使其成为风靡一时的工作。其实,可以做的工作还有很多,比如,既然你有一个产生类似数据的工具,那么其实你就有了一个做数据增强的工具,也就是对于你的神经网络来说,你有更多的训练数据了。很多人可能会觉得这个想法很简单,其实并不然。因为GAN本身用神经网络训练,如果你能把它融入你的一个任务当中,只用加一些损失函数,其实就能提高你任务上的性能,而且很多人还会觉得你性能好是因为加了神奇的损失函数,其实不过是用GAN做了一些隐式的数据增强吧了。但是你可以随便吹自己的模型是多么厉害,损失函数设计得多么有意义,多绕几下,别人也就忘了不就是GAN增强了数据嘛。因为GAN给各个任务开了一条提高性能的大门,那每把GAN用在一个任务上,就得引用GAN这篇论文,引用量上去了自然就火了。而且原始GAN是难训练或者效果差的,那么这些嗷嗷待哺的任务和相关研究人员自然也会更多关注GAN的发展,以期望在自己的任务上用到最新,最好的技术。所以,最近做提高和改进GAN的工作也取得了极大的关注度。那么再解释一下这个工作变火的本质:以前的神经网络存在生成困难的问题,GAN提供了解决办法,该方法简单、强大、适用性广。
05-11 21:46