我想估计所需的样本量,以使用Python计算离散数据的卡方检验(均质性检验),并需要提示如何执行。
总的来说,我想估计两个生产过程的失败率是否存在显着差异(alpha = 5%)。
我只找到了statsmodels.stats.gof.chisquare_effectsize()函数,但这似乎仅适用于拟合优度测试。
有什么方法可以确定所需的样本量?
我感谢每一个答案。
最佳答案
您可以使用statsmodels.stats.GofChisquarePower()。solve_power()
但是,您需要调整自由度(df)来考虑变量的数量。您可以使用n_bins参数来完成此操作。
>>>import statsmodels.stats.power as smp
>>>n_levels_variable_a = 2
>>>n_levels_variable_b = 3
>>>smp.GofChisquarePower().solve_power(0.346, power=.8, n_bins=(n_levels_variable_a-1)*(n_levels_variable_b-1), alpha=0.05)
115.94688728433769
关于python - 估计卡方检验所需的样本量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45968611/