我的矩阵很大,缺少很多值。我想获得变量之间的相关性。

1. 是解决方案

cor(na.omit(matrix))

比下面更好?
cor(matrix, use = "pairwise.complete.obs")

我已经只选择了缺失值超过20%的变量。

2. 哪种方法最有意义?

最佳答案

我会投票赞成第二种选择。听起来您好像有很多丢失的数据,因此您将寻找一种明智的多重插补策略来填补空白。有关“如何正确执行此操作”的大量指导,请参见Harrell的文章“回归建模策略”。

关于r - 处理缺失值以进行相关性计算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7445639/

10-12 17:30