我想使用线性混合模型并在总体水平上进行预测(即仅使用固定效应并使用 0 而不是随机效应)。

示例模型:

require(lme4)

fm1 <- lmer(Reaction ~ Days + (Days | Subject), sleepstudy)
summary(fm1)
# values for prediction:
newx <- seq(min(sleepstudy$Days), max(sleepstudy$Days))

我尝试了几种人口水平的预测方法,但都失败了:
pred <- predict(fm1, newdata = data.frame(Days = newx), allow.new.levels = TRUE)
# Error: couldn't evaluate grouping factor Subject within model frame: try adding grouping factor to data frame explicitly if possible

pred <- predict(fm1, newdata = data.frame(Days = newx, Subject = NA), allow.new.levels = TRUE)
# Error: Invalid grouping factor specification, Subject

pred <- predict(fm1, newdata = data.frame(Days = newx, Subject = as.factor(NA)), allow.new.levels = TRUE)
# Error: Invalid grouping factor specification, Subject

我试图找到正确预测方法的手册,但我不知道如何?我试图查看 help(package = "lme4") 并且我发现的最接近的函数是 predict.merMod (尽管模型 fm1 的类是 lmerMod 而不是 merMod )。 ?predict.merMod 内容如下:



它特别指出“或 NAs”,但它显然不是那样工作的!!
  • 我在看正确方法的帮助页面吗?如果没有,正确的方法是什么?
  • 如何在人口层面进行预测?
  • 最佳答案

    您正在寻找 re.form :


    require(lme4)
    fm1 <- lmer(Reaction ~ Days + (Days | Subject), sleepstudy)
    newx <- seq(min(sleepstudy$Days), max(sleepstudy$Days))
    predict(fm1, newdata=data.frame(Days=newx), re.form=NA)
    ##        1        2        3        4        5        6        7        8
    ## 251.4051 261.8724 272.3397 282.8070 293.2742 303.7415 314.2088 324.6761
    ##        9       10
    ## 335.1434 345.6107
    

    至于你的其他问题:
  • merMod 是一个“父类(super class)”,包括线性( lmerMod )和广义线性( glmerMod )模型:参见 ?"merMod-class"
  • 你的第二次尝试可能应该有效;然而,allow.new.levels 是为偶尔有 NA 值的情况而设计的,并非所有 NA 值...... predict(fm1, newdata = data.frame(Days = newx, Subject = "a"), allow.new.levels = TRUE) 确实有效。看起来代码检测到一个 all-NA 列并将其解释为上游出现问题 - 这可以在代码中修复,但由于 re.form 存在,所以似乎不是非常高的优先级。
  • 关于r - lmer : predictions on population level trigger an error,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34513330/

    10-09 17:08