运用PCA对高维数据进行降维,有一下几个特点:

(1)数据从高维空间降到低维,因为求方差的缘故,相似的特征会被合并掉,因此数据会缩减,特征的个数会减小,这有利于防止过拟合现象的出现。但PCA并不是一种好的防止过拟合的方法,在防止过拟合的时候,最好是对数据进行正则化;

(2)使用降维的方法,使算法的运行速度加快;

(3)减少用来存储数据的内存空间;

(4)从x(i)到z(i)的映射过程中,对训练数据进行降维,然后对测试数据或验证数据进行降维;

05-11 18:17