我有一个很大的相关矩阵(1093 x 1093)。我正在尝试将矩阵放入一个数据框,该数据框的每一行和每一列对都具有一列,因此它将是(1093)^ 2条记录。

这是我的矩阵的一小段

            60516        45264        02117
60516  1.00000000 -0.370793012 -0.082897941
45264 -0.37079301  1.000000000  0.005145601
02117 -0.08289794  0.005145601  1.000000000


从这里开始的目标是拥有一个看起来像这样的数据框:

row column correlation
60516 60516 1.000000000
60516 45264 -0.370793012


........ 等等。

有人有提示吗?让我知道是否可以澄清任何事情

谢谢,

最佳答案

对于矩阵m,您可以执行以下操作:

data.frame(row=rownames(m)[row(m)], col=colnames(m)[col(m)], corr=c(m))

#     row   col         corr
# 1 60516 60516  1.000000000
# 2 45264 60516 -0.370793010
# 3 02117 60516 -0.082897940
# 4 60516 45264 -0.370793012
# 5 45264 45264  1.000000000
# 6 02117 45264  0.005145601
# 7 60516 02117 -0.082897941
# 8 45264 02117  0.005145601
# 9 02117 02117  1.000000000


但是,如果矩阵是对称的,并且对对角线不感兴趣,则可以将其简化为:

data.frame(row=rownames(m)[row(m)[upper.tri(m)]],
           col=colnames(m)[col(m)[upper.tri(m)]],
           corr=m[upper.tri(m)])

#     row   col         corr
# 1 60516 45264 -0.370793012
# 2 60516 02117 -0.082897941
# 3 45264 02117  0.005145601

08-07 17:07