我的矩阵很大,缺少很多值。我想获得变量之间的相关性。
1. 是解决方案
cor(na.omit(matrix))
比下面更好?
cor(matrix, use = "pairwise.complete.obs")
我已经只选择了缺失值超过20%的变量。
2. 哪种方法最有意义?
最佳答案
我会投票赞成第二种选择。听起来您好像有很多丢失的数据,因此您将寻找一种明智的多重插补策略来填补空白。有关“如何正确执行此操作”的大量指导,请参见Harrell的文章“回归建模策略”。
关于r - 处理缺失值以进行相关性计算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7445639/