运行MICE程序包后,在5个完整插补集中的每个插补集中,缺失值的数量从147428减少到46093。但这不是应该是0个NA吗???

谢谢!

这是我的MICE代码:

imp = mice(newdata)

imputationSet1 = complete(imp)
imputationSet2 = complete(imp,2)
imputationSet3 = complete(imp,3)
imputationSet4 = complete(imp,4)
imputationSet5 = complete(imp,5)

最佳答案

Ben,mice()函数检测多重共线性,并通过删除矩阵的一个或多个预测变量来解决问题。每次删除都在mids对象的loggingEvents元素中记录。例如,



通知我们重复的变量chl2在迭代之前已被删除。该算法还在迭代过程中检测多重共线性。

控制该算法的另一种措施是ridge参数。 ridge参数被指定为mice()的参数。设置ridge = 0.001或ridge = 0.01可以使算法更健壮,但要以偏差为代价。

在终端节点,我们可以应用简单的方法,例如mice.impute.sample(),它本身不需要任何预测变量。

此信息摘自Stef van Buuren着的《缺少数据的灵活插补》,第1页。 129

关于r - 数据集中剩余的R静止NA中的归因MICE,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20947908/

10-12 22:49