我知道主成分分析会对矩阵进行SVD,然后生成特征值矩阵。要选择主要成分,我们仅需采用前几个特征值。现在,我们如何决定应从特征值矩阵中获取的特征值数量?
最佳答案
要确定要保留多少个特征值/特征 vector ,应首先考虑进行PCA的原因。您是为了降低存储需求,降低分类算法的维数还是其他原因而这样做?如果没有严格的限制,建议您绘制特征值的累加总和(假设它们按降序排列)。如果在绘图之前将每个值除以特征值的总和,则绘图将显示保留的总方差与特征值数量的比例。然后,该图将很好地指示您何时到达 yield 递减点(即,通过保留其他特征值获得的差异很小)。
关于machine-learning - 采取几个主要成分?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12067446/