考虑随机效应后,两个/更多的预测变量可以变得更多/更少共线吗?
就我而言,我在建模之前已经测试了共线性,例如使用VIF,一切检查完毕。但是,不同模型的排名(使用IC)使我不确定它是否真的可以在预测变量之间进行区分。
有任何想法吗?
ps!代表比我高的人可以添加更相关的标签,例如共线性吗?
最佳答案
在此blog post上列出了一些解决方案。他们使用一些代码来创建一个函数,该函数将分别从lmer
和lme
R包中为lmer
和nlme
模型对象计算VIF。我已经复制了以下函数的代码。
vif.lme <- function (fit) {
## adapted from rms::vif
v <- vcov(fit)
nam <- names(fixef(fit))
## exclude intercepts
ns <- sum(1 * (nam == "Intercept" | nam == "(Intercept)"))
if (ns > 0) {
v <- v[-(1:ns), -(1:ns), drop = FALSE]
nam <- nam[-(1:ns)] }
d <- diag(v)^0.5
v <- diag(solve(v/(d %o% d)))
names(v) <- nam
v }
一旦运行了该代码,就可以在R环境中执行一个新函数
vif.lme
。我在下面给出一个使用随机数据集和无信息的随机效果的示例。我使用了无信息的随机效应,以便lme
中的nlme
的结果将生成与基数R中的lm
相同的预测变量参数值。然后,我使用上述代码计算方差膨胀因子以及vif
的car
functino软件包,用于计算线性模型的VIF,以显示它们给出相同的输出。#make 4 vectors- c is used as an uninformative random effect for the lme model
a<-c(1:10)
b1<-c(2,4,6,8,10,100,14,16,18,20)
b2<-c(1,9,2,4,5,6,4,3,2,-1)
c<-c(1,1,1,1,1,1,1,1,1,1)
test<-data.frame(a,b1,b2,c)
#model a as a function of b1 and b2, and c as a random effect
require(nlme)
fit<-lme(a~b1+b2, random=~1|c,data=test)
#see how the model fits
summary(fit)
#check variance inflation factors
vif.lme(fit)
#create a new regular linear regression model and check VIF using the car package.
#answers should be the same, as our random effect above was totally uninformative
require(car)
fit2<- lm(a~b1+b2,data=test)
#check to see that parameter fits are the same.
summary(fit2)
#check to see that variance inflation factors are the same
vif(fit2)