嗨,我正在使用R,并且有一个集群分配矩阵来自我的集群函数。 (我正在对高斯混合数据应用聚类算法)我想创建聚类的数据矩阵。这是我想做的一个玩具示例。

#simulate data

dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
 dat
 [1] -0.5350681  1.0444655  2.9229136  8.2528266 -0.7561170 -1.0240702     -1.0012780
 [8] -0.1322981  7.8525855  2.2278264

# Making up a cluster assignment matrix (actually this one comes out of my
#clustering function

amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
        amat
       [,1] [,2]
 [1,]    1    0
 [2,]    1    0
 [3,]    0    1
 [4,]    0    1
 [5,]    1    0
 [6,]    1    0
 [7,]    1    0
 [8,]    0    1
 [9,]    0    1
[10,]    0    1


我想使用上面给出的赋值矩阵创建一个名为(clust)的数据框或矢量,其中包含簇标签,如下所示。基本上,它使用赋值矩阵的第一列和第二列,并将标签1分配给来自正态分布N( 0,1),并为来自正态分布N(2,3)的数据分配标签2。不胜感激。提前致谢。

    # clust should look like this (I have no idea how to create this using amat and dat)

    clust
 [1] 1 1 2 2 1 1 1 2 2 2

最佳答案

向量已经是二进制的。我们可以将1L添加到第二列:

clust <- amat[,2] + 1L
[1] 1 1 2 2 1 1 1 2 2 2


(后缀L将值强制为integer

08-25 03:34