GAN所建立的一个学习框架,实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。
“生成对抗网络是一种生成模型(Generative Model),其背后基本思想是从训练库里获取很多训练样本,从而学习这些训练案例生成的概率分布。
公式为:
其中分为2个模型:
两个模型的训练过程:
而与这个目的相反的是,生成模型G的训练目标,就是要最小化判别模型D的判别准确率。在训练过程中,GAN采用了一种非常直接的交替优化方式,它可以分为两个阶段,第一个阶段是固定判别模型D,然后优化生成模型G,使得判别模型的准确率尽量降低。而另一个阶段是固定生成模型G,来提高判别模型的准确率。
判别器模型:判断是否属于符合真实数据的概率分布。
判别器是如何进行训练的:不断向里面输入数据,数据可能包含生成模型中产生的数据,也可能是真实数据中的数据,在下面这张图中,阐述了判别器模型是如何进行训练的,当输入的数据为生成器模型产生的数据时,判别器判别为真实数据时,则证明此判别器训练成功,并且生成器模型也训练成功了。如何提高判定的准确率,当输入的数据为生成器模型的数据时,判别器模型判别为真实数据时,则要进行反向传播,修改判别器模型中的权值,使其产生的熵最小。
生成器模型:生成符合真实的概率分布。
生成器模型如何进行训练:
当生成器模型生成的数据输入到判别器模型时,判别器模型判定为假时,则进行反向传播,修改生成器模型中的权值,如何判断此模型已经训练完成,当输入到判别器的数据判别器无法进行判别为真实数据或者模拟数据时,则证明此模型已经训练完成(此时的判别器模型的准确率已经达到了非常高的准确率)
DCGAN,使用卷积神经网络,实现有效训练,拓展维度。去掉G网络D网络的pooling layer。在G网络D网络中使用Batch Normalization。去掉全连接隐藏层。G网络最后一层用Tanh,其它层用RELU。D网络每层用LeakyRELU。
G网络4层反卷积,D网络4层卷积。G网络D网络反结构。D网络最终输出,一种方法,sigmoid输出0到1间单值作概率;另一种方法softmax输出两个值,真概率、假概率