我在数据框列表上运行健壮的线性回归模型(使用MASS库中的rlm)时遇到问题。

可重现的示例:

var1 <- c(1:100)
var2 <- var1*var1
df1  <- data.frame(var1, var2)
var1 <- var1 + 50
var2 <- var2*2
df2  <- data.frame(var1, var2)
lst1 <- list(df1, df2)


线性模型(有效):

lin_mod <- lapply(lst1, lm, formula = var1 ~ var2)
summary(lin_mod[[1]])


我的健壮模型代码:

rob_mod <- lapply(lst1, MASS::rlm, formula = var1 ~ var2)


给出以下错误:

Error in rlm.default(X[[i]], ...) :
argument "y" is missing, with no default


我该如何解决?

我实际数据中的错误是:

Error in qr.default(x) : NA/NaN/Inf in foreign function call (arg 1)
In addition: Warning message:
In storage.mode(x) <- "double" : NAs introduced by coercion

最佳答案

您的呼叫缺少data参数。 lapply将使用列表的每个成员作为FUN的第一个参数调用FUN,但是datarlm的第二个参数。

解决方案是定义一个匿名函数。

lin_mod <- lapply(lst1, function(DF) MASS::rlm(formula = var1 ~ var2, data = DF))
summary(lin_mod[[1]])
#
#Call: rlm(formula = var1 ~ var2, data = DF)
#Residuals:
#    Min      1Q  Median      3Q     Max
#-18.707  -5.381   1.768   6.067   7.511
#
#Coefficients:
#              Value   Std. Error t value
#(Intercept) 19.6977  1.0872    18.1179
#var2         0.0092  0.0002    38.2665
#
#Residual standard error: 8.827 on 98 degrees of freedom

关于r - Lapply的稳健线性回归,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51521987/

10-12 17:35
查看更多