我试图显示在rstanarm()中的贝叶斯线性模型中,一个变量的作用如何随另一个变量的值变化。我能够拟合模型并从后验中抽出以查看每个参数的估计值,但是尚不清楚如何绘制一个变量在交互中的影响以及其他变化和相关不确定性的某种图表(即边际效应图)。以下是我的尝试:
library(rstanarm)
# Set Seed
set.seed(1)
# Generate fake data
w1 <- rbeta(n = 50, shape1 = 2, shape2 = 1.5)
w2 <- rbeta(n = 50, shape1 = 3, shape2 = 2.5)
dat <- data.frame(y = log(w1 / (1-w1)),
x = log(w2 / (1-w2)),
z = seq(1:50))
# Fit linear regression without an intercept:
m1 <- rstanarm::stan_glm(y ~ 0 + x*z,
data = dat,
family = gaussian(),
algorithm = "sampling",
chains = 4,
seed = 123,
)
# Create data sets with low values and high values of one of the predictors
dat_lowx <- dat
dat_lowx$x <- 0
dat_highx <- dat
dat_highx$x <- 5
out_low <- rstanarm::posterior_predict(object = m1,
newdata = dat_lowx)
out_high <- rstanarm::posterior_predict(object = m1,
newdata = dat_highx)
# Calculate differences in posterior predictions
mfx <- out_high - out_low
# Somehow get the coefficients for the other predictor?
最佳答案
在这种情况下(线性,高斯,身份链接,无截距),
mu = beta_x * x + beta_z * z + beta_xz * x * z
= (beta_x + beta_xz * z) * x
= (beta_z + beta_xz * x) * z
因此,要绘制
x
或z
的边际效应,您只需要每个系数的适当范围和系数的后验分布即可,您可以通过post <- as.data.frame(m1)
然后
dmu_dx <- post[ , 1] + post[ , 3] %*% t(sort(dat$z))
dmu_dz <- post[ , 2] + post[ , 3] %*% t(sort(dat$x))
然后,您可以使用以下类似方法估算数据中每个观察值的单个边际效应,该结果为数据中每个观察值计算
x
对mu
的影响以及z
对对于每个观察。colnames(dmu_dx) <- round(sort(dat$x), digits = 1)
colnames(dmu_dz) <- dat$z
bayesplot::mcmc_intervals(dmu_dz)
bayesplot::mcmc_intervals(dmu_dx)
请注意,在这种情况下,列名称只是观察值。