我想估计所需的样本量,以使用Python计算离散数据的卡方检验(均质性检验),并需要提示如何执行。

总的来说,我想估计两个生产过程的失败率是否存在显着差异(alpha = 5%)。

我只找到了statsmodels.stats.gof.chisquare_effectsize()函数,但这似乎仅适用于拟合优度测试。

有什么方法可以确定所需的样本量?

我感谢每一个答案。

最佳答案

您可以使用statsmodels.stats.GofChisquarePower()。solve_power()
但是,您需要调整自由度(df)来考虑变量的数量。您可以使用n_bins参数来完成此操作。

>>>import statsmodels.stats.power as smp
>>>n_levels_variable_a = 2
>>>n_levels_variable_b = 3
>>>smp.GofChisquarePower().solve_power(0.346, power=.8, n_bins=(n_levels_variable_a-1)*(n_levels_variable_b-1), alpha=0.05)


115.94688728433769

关于python - 估计卡方检验所需的样本量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45968611/

10-12 17:49