我从某些消息来源得知,生成对抗网络是无监督的ML,但我不明白。生成对抗网络实际上不受监督吗?
1)2类情况真实反对假冒
实际上,必须向歧视者提供训练数据,而这必须是“真实”数据,即我将用f.e.标记的数据。 1.即使没有显式标记数据,也可以通过在第一步中向鉴别器提供训练数据来隐式地进行标记,您会告诉鉴别器是真实的。这样,您就以某种方式告诉鉴别者训练数据的标签。相反,在生成器的第一步生成的噪声数据的标记,生成器知道这是不真实的。
2)多类案例
但是在多类情况下,它确实变得很奇怪。必须在训练数据中提供描述。明显的矛盾是,人们对一种无监督的ML算法做出了回应。
最佳答案
GAN是无监督的学习算法,它在训练中使用了监督性损失。后者似乎是您挂断电话的地方。
当我们谈论监督学习时,我们通常是在谈论预测与数据相关的标签的学习。目标是使模型推广到新数据。
在GAN情况下,您没有任何一个组件。数据没有标签,因此我们不尝试将任何形式的预测推广到新数据。 GAN的目标是对数据的外观进行建模(即密度估计),并能够生成有关其所学知识的新示例。
GAN设置了有监督的学习问题,以便进行无监督的学习,生成伪造/随机的数据,并尝试确定样本是生成的伪造数据还是真实数据。这是一个受监督的组件,是的。但这不是GAN的目标,而且标签很琐碎。
使用无监督组件执行无监督任务的想法并不是特别新颖。随机森林已经做了很长时间的离群值检测(也对随机数据和真实数据进行了训练),用于离群值检测的一类SVM在监督方式下进行了技术训练,原始数据为真实类和单点在空间的原点(即零 vector )处被视为异常值类。
关于machine-learning - GAN是无人监管还是无人监管?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44445778/