这个问题是关于语法和语义的,因此请在“交叉验证”中找到一个(尚未答复)重复:https://stats.stackexchange.com/questions/113324/repeated-measures-anova-ezanova-vs-aov-vs-lme-syntax
在机器学习领域,我在相同的5个数据集上评估了4个分类器,即每个分类器返回了数据集1、2、3,...和5的性能指标。现在,我想知道分类器在它们的分类上是否有显着差异性能。这是一些玩具数据:
Performance<-c(2,3,3,2,3,1,2,2,1,1,3,1,3,2,3,2,1,2,1,2)
Dataset<-factor(c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5))
Classifier<-factor(c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4))
data<-data.frame(Classifier,Dataset,Performance)
读完一本教科书后,我进行了重复测量的单向方差分析。我将性能解释为因变量,将分类器解释为主题,将数据集解释为主题内因素。使用aov,我得到了:
model <- aov(Performance ~ Classifier + Error(factor(Dataset)), data=data)
summary(model)
产生以下输出:
Error: factor(Dataset)
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 4 2.5 0.625
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Classifier 3 5.2 1.7333 4.837 0.0197 *
Residuals 12 4.3 0.3583
使用线性混合效应模型时,我得到类似的结果:
model <- lme(Performance ~ Classifier, random = ~1|Dataset/Classifier,data=data)
result<-anova(model)
然后,我尝试使用ezANOVA重现结果,以便执行Mauchlys球形性测试:
ezANOVA(data=data, dv=.(Performance), wid=.(Classifier), within=.(Dataset), detailed=TRUE, type=3)
产生以下输出:
Effect DFn DFd SSn SSd F p p<.05 ges
1 (Intercept) 1 3 80.0 5.2 46.153846 0.00652049 * 0.8938547
2 Dataset 4 12 2.5 4.3 1.744186 0.20497686 0.2083333
显然这与先前的aov / lme输出不对应。但是,当我在ezANOVA定义中将“性能”与“分类器”交换时,我得到了预期的结果。
我现在想知道我的教科书是错误的(Aov定义)还是我误解了ezANOVA语法。此外,为什么在重写ezANOVA语句时只获得Mauchly的测试结果,而在第一种情况下却没有?
最佳答案
由于要比较分类器而不是数据集,因此,内部因子是分类器,内部ID是数据集。因此,您的ezANOVA示例的正确语法为:
ezANOVA(data=data, dv=.(Performance), within=.(Classifier), wid=.(Dataset), detailed=TRUE)
顺便说一句,无需指定平方和的类型。由于只有一个因数,因此所有类型的平方和无论如何都会产生相同的结果。