了解什么是有效大小,尝试一个单一样本t检验的完整示例。
效应量
调查研究的一个重要方面是效应量,在实验性研究中或存在处理变量的研究中,效应量是指处理效应的大小,意思很直观;
在非实验性研究中,效应量是指变量之间的关系强度,在 z 检验或 t 检验中,最简单的效应量衡量指标是均值差异,即两个均值之间的差异,在 z 检验或单样本 t 检验中,均值差异等于 x 拔减去 μ,当变量的含义很容易明白时,也就是说不需要专门的训练就知道其中的含义,这时候均值差异就很有用。
来做一道小测试题,以下哪些变量的含义比较难懂? A.考试时答对的题目数量
B.修好轮胎花费的分钟数
C.Laraway 性格测试的得分
D.睡眠小时数
C
在我看来 Laraway 性格测试的得分含义并不好懂,也就是说,如果不接受特殊培训的话,你不一定知道这个测试得分的含义是什么,顺便说下,这个测试是我杜撰的,实际上并不存在,再来看看其他选项,考试时答对的题目数量含义好懂,我们都知道是什么意思,修好轮胎花费的分钟数和睡眠小时数也一样,当我们不知道变量的含义是什么的时候,均值差异可能并不是信息最充分的度量方法,因此 统计学家们制定了其他效应量度量,我们将讨论这些度量。
效应量度量有很多种,但多数都属于两大主要类别,即两个系列:第一种叫做差异度量,最简单的差异度量是均值差异;另一种类型叫做标准化差异,有好几种类型的标准化差异度量,我们将重点讨论其中一种度量,也就是 Cohen's d,在这门课程的后续内容中,我们都将使用这一标准化差异度量,注意,作为标准化差异度量,Cohen's d 实际上度量的是均值差异,并用标准偏差作为单位。
另一个系列叫做相关度量,和标准化均值差异一样,相关度量同样也存在几种不同的类型,我们将重点讨论其中一种 叫做 r^2,r^2 表示的是某个变量的变化比例,或百分比与另一个变量的关系,有时候我们用解释而不是相关来表示,解释是指通过知道另一个变量的值能够解释某个变量的特定变化百分比或比例。
统计显著性
在统计学里,统计显著性有特殊的含义,不太容易直观地理解,与我们通常对“significance”一词的理解不太一样,在日常生活中 我们使用“significant”表示事物对我们来说很重要,事物很大或相当大,意义重大,在统计学里,统计显著性跟这些含义没有丁点关系,统计显著性表示我们拒绝了零假设,还表示我们的结果不太可能是偶然发生的,或者抽样错误导致的。注意这个和这个只是两种不同的说法而已,要记住的是当你看见统计显著性这几个字,不能认为是指结果很重要,只是表示结果可能不是偶然产生的,也就是说,我们在解释结果时,排除了随机因素或抽样错误,这一点很重要,一定要记住。
那么如何判断某个调查研究的结果是否有意义或重要呢?我们要知道的一点是我们度量了什么?变量是什么?变量存在实际或社会意义或甚至理论意义吗?如果我们的变量在实际应用中,社会或理论领域不存在任何意义,那么很明显,结果无论是什么,都不重要。在评估结果的意义时要考虑的另一项方面是效应量,结果有多大?这并不表示小的结果不重要,或大的结果就一定重要,在评估结果的意义时我们会考虑到效应量,即使非常小的效应也可能很重要,最后要考虑的是我们能对结果排除随机因素吗?也就是说,我们在解释时能排除抽样错误吗?这并不能保证结果很重要,但是可以帮助我们评估重要性的其他内容,接着我们需要知道,我们是否能够排除结果的对立解释?这是我们之前讨论过的可怕潜在变量,所有这几个方面成为了评估研究结果是否有意义的大概指南,度量的什么?效应有多大?我们在解释结果时能排除随机因素吗?能排除潜在变量吗?
Cohen's d
Cohen's d 是一种效应量度量,表示的是标准化均值差异。
我们拆分下这个概念,我们已经知道均值差异是什么意思,均值差异是指均值之间的差异,例如:在单样本 z 检验和单样本 t 检验中,是 x 拔和 μ 之间的差异。你可能还记得我们在讨论 z 值时提到过归一化,我们说的 z 值归一化结果是指原始值和均值之间的差异,并除以标准偏差。Cohen's d 非常类似,它计算的也是差异,在这个单样本示例中,计算的是 x 拔和 μ 之间的差异,然后除以样本的标准偏差,所以称为标准化均值差异。因为我们知道均值差异,然后以标准偏差为单位,所以 Cohen's d 的含义是以标准偏差作为单位,这些均值之间相差多少。
r^2
r^2 表示的是两个变量之间的关系程度,有时候 r^2 称为确定系数,因为 r^2 是一个比例,范围从 0 到 1,r^2 值= 0 表示两个变量之间根本没有联系,r^2 值= 1 表示完全相关。
在进行 t 检验时,r^2 的公式可以根据 t 检验的信息推出,r^2 的公式等于 t^2/(t^2+df),这里的 t 值不是临界值,是我们从 t 检验中获得的值,计算 r^2 时,我们只需要算出 t 值 取平方,代入分子中,再取平方并加上自由度作为分母。
如果 t 等于 ,自由度是 ,请算出 r^。
结果为 0.17
当我们开展调查研究并计算统计结果时,我们会在结果部分报告这些结果,结果部分会填入哪些内容?
.描述统计量,例如均值和标准偏差,描述统计量是研究的核心,告诉我们研究中发生的情况 应该始终报告出来,我们可以通过三种方式来报告,我们可以用文本,即在结果部分直接写出来,我们可以用图表来表示,例如条形
图,也可以用表格来表示。
.报告推论统计量,可以是假设检验,或置信区间,或者包含二者,在报告假设检验时,需要告诉读者以下几点信息,需要告诉读者你执行的是哪种检验,例如单样本检验,接着给出检验统计的实际值,例如 t 值,然后给出检
验的自由度,不是公式,而是公式计算出来的实际结果,还要告诉读者 P 值,如果可能的话,尽量提供精确的 P 值,接着,如果可能的话,给出检验方向,例如是单尾检验还是双尾检验,要始终提供 α 水平,始终让读者知
道你在做出决策时所使用的 α 水平,对很多学科来说,我们使用 APA 格式来报告假设检验的结果,APA 表示的是美国心理学会,APA 给出了如何撰写研究论文的完整指南,其中一部分告诉我们如何写出推论统计学结果,简
单介绍下统计学的 APA 格式,因为它与 t 检验相关,这是如何按照 APA 格式,写出 t 检验结果的一般规则,首先写出检验统计名称,在此示例中是 t 接着在括号中写出自由度,写上等号,然后给出 t 值,保留两位小
数,写上逗号,然后给出 P 值,同样保留两位小数,这个规则存在一些例外,但大多数情况下都是这一格式,然后输入逗号,并指明检验方向是单尾检验还是双尾检验。举个更加具体的例子,假设有个 t 值,自由度是 ,
结果等于 -2.50,如果手动计算的话,我们只知道 P 值是小于还是大于 0.05,进行的是单尾检验,这就是最后写出的结果,如果我们通过计算机算出结果的话,我们就知道精确的 P 值,精确的单尾 P 值保留两位小数
是 0.01,在这种情况下,我们实际上可以写成 P=0.01
3.写出效应量度量结果,可以是 Cohen's d、r^2 或二者均有。
t(df) = x.xx,p = .xx,diection
t(24) = -2.50,p < .05,one-tailed