我得到了原始样本数据及其模拟数据(不要问我如何模拟),我想检查直方图是否匹配。因此最好的方法是使用qqplot
,但是statsmodels
库不允许使用不同大小的样本。
最佳答案
构建一个qq图涉及在两个集合中找到相应的分位数,并将它们相对绘制。在一个集合大于另一个集合的情况下,通常的做法是采用较小集合的分位数级别,并使用线性插值法估计较大集合中的相应分位数。此处描述:http://www.itl.nist.gov/div898/handbook/eda/section3/qqplot.htm
手动执行此操作相对简单:
import numpy as np
import pylab
test1 = np.random.normal(0, 1, 1000)
test2 = np.random.normal(0, 1, 800)
#Calculate quantiles
test1.sort()
quantile_levels1 = np.arange(len(test1),dtype=float)/len(test1)
test2.sort()
quantile_levels2 = np.arange(len(test2),dtype=float)/len(test2)
#Use the smaller set of quantile levels to create the plot
quantile_levels = quantile_levels2
#We already have the set of quantiles for the smaller data set
quantiles2 = test2
#We find the set of quantiles for the larger data set using linear interpolation
quantiles1 = np.interp(quantile_levels,quantile_levels1,test1)
#Plot the quantiles to create the qq plot
pylab.plot(quantiles1,quantiles2)
#Add a reference line
maxval = max(test1[-1],test2[-1])
minval = min(test1[0],test2[0])
pylab.plot([minval,maxval],[minval,maxval],'k-')
pylab.show()
关于python - 如何在python中不同大小的两个样本之间创建qq图?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42658252/