我在datacamp.com上遇到这个问题:
下面是同一点云的三个散点图。每个散点图显示一组不同的轴(红色)。在哪一个图中,轴可以表示点云的主要成分?
还记得主成分是数据变化的方向吗?
回答:
地块1和3
我的问题是这个问题是什么意思?为什么图2不是答案的一部分,因为轴可以旋转以适应点云。
python - PCA的主要组成部分-LMLPHP

最佳答案

正如评论中所建议的,这更适合交叉验证,或者可能是math.stackexchange。
现在的答案在直觉上相当简单。
主要成分可以通过迭代过程获得,这样:
第一主成分等同于线性组合a_1 %*% X,最大化Var(a_1 %*% X)受试者t(a_1) %*% a_1 = 1
第二主成分等同于线性组合a_2 %*% X,最大化Var(a_2 %*% X)受试者t(a_2) %*% a_2 = 1cov(a_1 %*% X, a_2 %*% X) = 0
第三个——| |--
从这个定义中可以注意到,var(a_1 %*% X) = var( - a_1 %*% X),因此主成分的确定取决于成分的符号。
从这个定义我们可以看出:
一。1和3是等价的,因为第一条(最长)直线在点分布最广的方向(显示最大方差)
2。第二个图不能是主成分,因为方向与方差最大的方向不一致
Applied Multivariate Statistical Analysis的第8章第430页(ish)包含了更详细的理论解释。

关于python - PCA的主要组成部分,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56110151/

10-12 12:48
查看更多