我正在使用seaborn的箱形图,但似乎无法弄清楚默认设置中晶须的位置。

查看seaborn.boxplot docs时,我发现我假定的whis=1.5意味着晶须位于UPPER_QUARTILE + IQR*1.5LOWER_QUARTILE - IQR*1.5处。

但是,即使在文档本身中,看着晶须,我们也可以看到它们与上/下四分位数的间隙长度不同

python - Seaborn的箱线图晶须含义-LMLPHP

不难看出,盒子两侧到胡须的长度不相等,因此我的假设显然是错误的。

那么如何放置默认晶须呢?还是我不了解关于箱形图的本质的更基本的知识?

最佳答案

IIRC中,晶须延伸到最低(最高)数据点,但仍在较低(最高)四分位数的1.5 IQR之内。因此,根据数据点的实际位置,两侧的晶须不一定具有相同的长度。

Matplotlib docs用于whisboxplot()参数(Seaborn建立在该参数上)似乎证实了这一点:


  whis:浮点数,序列或字符串(默认= 1.5)
  作为浮子,确定晶须到达第一和第三四分位数以外的范围。换句话说,在IQR是四分位间距(Q3-Q1)的情况下,上晶须将延伸到小于Q3 + whis * IQR的最后数据。同样,下晶须将延伸到大于Q1的第一个基准-whis * IQR。除晶须外,数据被认为是离群值,并作为单个点绘制。

08-20 01:10