我最近阅读了PCA(原理组件分析),并了解了如何减小尺寸。当我们只需要一个维度时,我们选择一个对应于最大特征值的特征向量,但是如果需要一个以上维度,那么我应该采用对应于最大特征值的特征向量吗?
最佳答案
主成分分析(PCA)是一种统计技术,它执行正交变换以将一组可能相关的变量的观测值转换为一组线性不相关的变量值(称为主成分)。
PCA转换后的组件数等于变量数。这种转换的定义方式是,第一个主成分具有最大可能的方差(也就是说,它占了数据中尽可能多的可变性),而每个后续成分又具有最大的方差。约束它与前面的组件正交。所得向量是不相关的正交基集。
通常,人们所占的分量尽可能多,而方差占99%,这要比变量总数少得多。
参考文献:
https://stats.stackexchange.com/a/140579/86202
http://scikit-learn.org/stable/modules/decomposition.html#pca
https://en.wikipedia.org/wiki/Principal_component_analysis