我想在clusplot
图中添加用于pca的变量作为箭头。我不确定是否已实现一种方法(我在文档中找不到任何内容)。
我制作了一个如下所示的clusplot:
使用princomp
包,我可以在类似的表示空间中独立地绘制观察结果,其中变量(列)为箭头:
有没有一种方法可以通过在同一图中显示pca的簇和变量来同时做两件事?
最佳答案
我今天想做与OP相同的事情,最终将clusplot
和biplot
的片段放在一起。如果您想做同样的事情,这是有用的结果:
clusplot2 <- function(dat, clustering, ...) {
clusplot(dat, clustering, ...)
## this is from clusplot.default
pca <- princomp(dat, scores = TRUE, cor = (ncol(dat) != 2))
## this is (adapted) from biplot.princomp
directions <- t(t(pca$loadings[, 1:2]) * pca$sdev[1:2]) * sqrt(pca$n.obs)
## all below is (adapted) from biplot.default
unsigned.range <- function(x) c(-abs(min(x, na.rm = TRUE)),
abs(max(x, na.rm = TRUE)))
x <- predict(pca)[, 1:2]
y <- directions
rangx1 <- unsigned.range(x[, 1L])
rangx2 <- unsigned.range(x[, 2L])
rangy1 <- unsigned.range(y[, 1L])
rangy2 <- unsigned.range(y[, 2L])
xlim <- ylim <- rangx1 <- rangx2 <- range(rangx1, rangx2)
ratio <- max(rangy1/rangx1, rangy2/rangx2)
par(new = T)
col <- par("col")
if (!is.numeric(col))
col <- match(col, palette(), nomatch = 1L)
col <- c(col, col + 1L)
cex <- rep(par("cex"), 2)
plot(y, axes = FALSE, type = "n", xlim = xlim * ratio, ylim = ylim *
ratio, xlab = "", ylab = "", col = col[1L])
axis(3, col = col[2L])
axis(4, col = col[2L])
box(col = col[1L])
text(y, labels = names(dat), cex = cex[2L], col = col[2L])
arrows(0, 0, y[, 1L] * 0.8, y[, 2L] * 0.8, col = col[2L],
length = 0.1)
}
############################################################
library(cluster)
dat <- iris[, 1:4]
clus <- pam(dat, k = 3)
clusplot2(dat, clus$clustering, main = "Test")
当然,还有很多改进的余地(因为这是一起复制的),但是我认为任何人都可以根据需要轻松地进行调整。
如果您想知道为什么将箭头(载荷* sdev)缩放为0.8 * sqrt(n):我绝对不知道。我本来可以画出载荷* sdev,它应该类似于主成分和变量之间的相关性,但这是
biplot
做到的方式。无论如何,这应该产生与
biplot.princomp
相同的箭头,并使用与clusplot
相同的pca,这是我的主要目标。关于r - clusplot-显示变量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29770547/