我有一个很大的数据框,我想按某列进行分组,并使用箱线图以图形方式检查每组的分布。我发现df.boxplot()将对数据帧的每一列执行此操作,并将其放置在一个绘图中,这正是我需要的。

问题是在进行groupby操作之后,我的数据全部放在一列中,而组标签在索引中,因此我无法在结果上调用boxplot。

这是一个例子:

df = DataFrame({'a':rand(10),'b':[x%2 for x in range(10)]})
df

         a   b
0    0.273548    0
1    0.378765    1
2    0.190848    0
3    0.646606    1
4    0.562591    0
5    0.409250    1
6    0.637074    0
7    0.946864    1
8    0.203656    0
9    0.276929    1

现在,我想按b列分组,并在一个箱线图中将两个组的分布进行箱线图绘制。我怎样才能做到这一点?

最佳答案

您可以使用byboxplot参数。那是您要找的东西吗?

df.boxplot(column='a', by='b')

关于pandas - 按列分组,然后按 Pandas 索引进行箱线图绘制,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20680596/

10-12 22:38