几种常见的假设检验总结如下:
假设检验名称 | Z检验 | t检验 | χ2检验 | F检验 |
原假设 | H: μ≥μH: μ≤μH: μ=μ(样本和总体均值) H: μ-μ≥0 H: μ-μ≤0 H: μ-μ=0 (两总体均值) H: μ≥0 H: μ≤0 H: μ=0 (两总体前后差值均值) | H: σ≥σH: σ≤σH: σ=σ(样本和总体方差) H: σ≤σH: σ=σ(两总体方差,即方差齐性) H: 两类别型变量相互独立(独立性检验) H: 总体服从某个概率分布(拟合优度检验) H: 总体均值相等(方差分析)--- 通常用于三个及以上的总体 | ||
备择假设 | H: μ<μH: μ>μH: μ≠μ(样本和总体均值) H: μ-μ<0 H: μ-μ>0 H: μ-μ≠0 (两总体均值) H: μ<0 H: μ>0 H: μ≠0 (两总体前后差值均值) | H: σ<σH: σ>σH: σ≠σ(样本和总体方差) H: σ>σH: σ≠σ(两总体方差) H: 两类别型变量不独立(独立性检验) H: 总体不服从某个概率分布(拟合优度检验) H: 总体均值不全相等(方差分析) | ||
检验类型 | 左尾 右尾 双尾 | 左尾 右尾 双尾 | ||
检验先决条件 | σ已知,样本量大于等于30 | σ未知 样本量小于30(当总体服从正态分布时) 样本量大于等于30(当总体不服从正态分布时) | 无 | 总体近似正态分布(两总体方差) 总体近似正态分布,总体方差相似(方差分析) |
检验统计量 | (样本和总体均值) (两总体均值)
| (样本和总体均值) (两总体均值,独立样本,两总体方差不相等) (两总体均值,独立样本,两总体方差相等) (两总体前后差值均值,配对样本) | (样本和总体方差) (独立性检验) (拟合优度检验) | (两总体方差) (单因素方差分析) |
决策方法 | 临界值法:如果z ≤ -z,则拒绝原假设(左尾) 如果z ≥ z,则拒绝原假设(右尾) 如果z ≤ -z或 z ≥ z,则拒绝原假设(双尾) (如果置信区间不包含μ,则拒绝原假设) p值法:如果p值≤α,则拒绝原假设 | 临界值法:如果t ≤ -t,则拒绝原假设(左尾) 如果t ≥ t,则拒绝原假设(右尾) 如果t ≤ -t或 t ≥ t,则拒绝原假设(双尾) (如果置信区间不包含μ,则拒绝原假设) p值法:如果p值≤α,则拒绝原假设 | 临界值法:如果χ ≤ χ,则拒绝原假设(左尾) 如果χ ≥ χ,则拒绝原假设(右尾) 如果χ ≤ χ或 χ ≥ χ,则拒绝原假设(双尾) (如果置信区间不包含σ,则拒绝原假设) p值法:如果p值≤α,则拒绝原假设 | 临界值法:如果F ≥ F,则拒绝原假设(右尾) 如果F ≥ F,则拒绝原假设(双尾) p值法:如果p值≤α,则拒绝原假设 |
| 注:p值法可以显示实际显著性,而临界值法不能。 | |||
python命令 |
| 1,单样本t检验:scipy.stats.ttest_1samp(a, popmean) 返回:t检验统计量的具体值和相应的p值(双尾) 2,配对t检验:scipy.stats.ttest_rel(a,b) 返回:t检验统计量的具体值和相应的p值(双尾) 3,独立样本t检验: scipy.stats.ttest_ind(a, b, equal_var=True) 或 scipy.stats.ttest_ind_from_stats (mean1,std1,nobs1,mean2,std2,nobs2,equal_var=True) --- 方差相等 scipy.stats.ttest_ind(a, b, equal_var=False) 或 scipy.stats.ttest_ind_from_stats (mean1,std1,nobs1,mean2,std2,nobs2,equal_var=False)--- 方差不相等 返回:t检验统计量的具体值和相应的p值(双尾) | 1,拟合优度检验:scipy.stats.chisquare(f_obs, f_exp=None, ddof=0) 返回:卡方统计量的具体值和相应的p值 2,独立性检验:scipy.stats.chi2_contingency(observed, correction=True) 返回:卡方统计量的具体值,相应的p值,自由度, 期望频率 | 1,方差齐性检验:scipy.stats.levene(sample1,sample2,...) 返回:F统计量的具体值和相应的p值 2,单因素方差分析:scipy.stats.f_oneway(sample1,sample2,...) 返回:F统计量的具体值和相应的p值 |
其他检验:
1,正态性检验:scipy.stats.shapiro(x)
返回:检验统计量的具体值和相应的p值