试图学习R。一个来自旧统计数据的问题想知道不同施工现场的休息时间是否有所不同。麻烦的是,案文决定每个站点雇用不同数量的 worker 。因此,我陷入困境并寻求使用样本量不相等的ANOVA的帮助。

site1 <- c(34,25,27,31,26,34,21)
site2 <- c(33,35,31,31,42,33)
site3 <- c(17,30,30,26,32,28,26,29)
site4 <- c(28,33,31,27,32,33,40)

最佳答案

试试这个

site1 <- c(34,25,27,31,26,34,21)
site2 <- c(33,35,31,31,42,33)
site3 <- c(17,30,30,26,32,28,26,29)
site4 <- c(28,33,31,27,32,33,40)

Data <- data.frame(
       Y=c(site1, site2, site3, site4),
       Site =factor(rep(c("site1", "site2", "site3", "site4"), times=c(length(site1), length(site2), length(site3), length(site4))))
       )

数据
  Y  Site
 34 site1
 25 site1
 27 site1
 31 site1
 26 site1
 34 site1
 21 site1
 33 site2
 35 site2
 31 site2
 31 site2
 42 site2
 33 site2
 17 site3
 30 site3
 30 site3
 26 site3
 32 site3
 28 site3
 26 site3
 29 site3
 28 site4
 33 site4
 31 site4
 27 site4
 32 site4
 33 site4
 40 site4

方差分析
fm1 <- aov(Y~Site, data=Data)
anova(fm1)

输出
Analysis of Variance Table

Response: Y
          Df Sum Sq Mean Sq F value  Pr(>F)
Site       3 212.35  70.782  3.4971 0.03098 *
Residuals 24 485.76  20.240
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

10-07 17:49