分类问题分为二分类和多分类。这个论文冒出来一个一分类,这是啥玩意?
经多方查证,一分类问题的答案就是“是”或者“不是”。比如问你”这是苹果吗“?你回答”是”或者”不是”。这就是一分类问题。再比如问你”这是苹果还是梨”?你回答”这是苹果”或者回答”这是梨”。这就是二分类问题。多分类问题实际上就是多个二分类问题。不做赘述。
这篇文章的主要目的是介绍一种他们研究出来的一种用于occ的对抗性神经模型avae。
什么是ooc?就是一分类。为什么研究这个?因为当训练数据都来自同一类别时,很难选择有区别的特征。你还记得当时学VAE吗?我们说怎么判断7来着?不是一横一竖,同时这一横和一竖之间需要有一定的角度,这些元素就是所谓的特征,这些特征确定了,就能写出一个数字7。而我们观测到的只是这个数字7的图像,对应的特征则是不知道的。值得一提的是,稍微改变一下这个特征,也能得到一个数字7,比如说一横和一竖之间的角度稍微变化一点,对应的也是一个7,只不过和之前的7略有不同。这不就是数据来源同一类别,但是特征内容有所不同吗?对于这样的我们怎么把它分成一类呢?随着深度学习在模式识别中的快速发展,使得模型不再依赖人工选择的特征,而是学习训练数据本身的有效视觉表征。大概就是说即使是同一类,但也是有区别的,人一眼就能看出来,但机器不行啊,只能循规蹈矩,但就看规定的这几个特征能行吗?可能会有问题,分辨不出来,所以让计算机自己找特征去吧!可是这些在某些特征方面的区别怎么找出来呢?就用我这个avae。
我们的OCC深度学习模型由重构器(R)和鉴别器(D)两部分组成。前者学习目标类别的视觉特征并对输入图像进行重构,后者通过对输入图像和重构图像进行分类来学习目标类别的特征。经过端到端的训练过程,R可以对目标类的图像进行重建,并对非目标类的图像进行变形,然后D可以输出重建图像是否属于目标类的概率。
训练有两步,分别是联合训练和 vae-only training。联合训练是训练判别器的,只训练VAE是就是训练VAE的生成、重构。
结论:提出了一种面向一类分类的端到端AVAE网络,该网络由重构器和鉴别器两部分组成。利用重构函数学习目标类图像的视觉特征,对非目标类图像进行重构和变形。鉴别器通过捕获重构目标类图像与重构非目标图像之间的差异来完成一类分类。此外,我们还提出了一种有效的培训方法,包括联合培训和纯vae培训两个步骤。联合训练的目的是训练识别器具有一定的识别真假数据的能力。而vaeonly训练则进一步提高了reconstructor很好地重构目标类图像的能力。这也使得鉴别器能够更好地对目标类和非目标类进行分类。在CIFAR-10上的实验结果表明,该方法可以有效地对彩色图像进行一类分类。