python - 估计卡方检验所需的样本量

我想估计所需的样本量，以使用Python计算离散数据的卡方检验（均质性检验），并需要提示如何执行。

总的来说，我想估计两个生产过程的失败率是否存在显着差异（alpha = 5％）。

我只找到了statsmodels.stats.gof.chisquare_effectsize()函数，但这似乎仅适用于拟合优度测试。

有什么方法可以确定所需的样本量？

我感谢每一个答案。

最佳答案

您可以使用statsmodels.stats.GofChisquarePower（）。solve_power（）
但是，您需要调整自由度（df）来考虑变量的数量。您可以使用n_bins参数来完成此操作。

>>>import statsmodels.stats.power as smp
>>>n_levels_variable_a = 2
>>>n_levels_variable_b = 3
>>>smp.GofChisquarePower().solve_power(0.346, power=.8, n_bins=(n_levels_variable_a-1)*(n_levels_variable_b-1), alpha=0.05)

115.94688728433769

关于python - 估计卡方检验所需的样本量，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/45968611/