我有一个很大的数据框,我想按某列进行分组,并使用箱线图以图形方式检查每组的分布。我发现df.boxplot()
将对数据帧的每一列执行此操作,并将其放置在一个绘图中,这正是我需要的。
问题是在进行groupby操作之后,我的数据全部放在一列中,而组标签在索引中,因此我无法在结果上调用boxplot。
这是一个例子:
df = DataFrame({'a':rand(10),'b':[x%2 for x in range(10)]})
df
a b
0 0.273548 0
1 0.378765 1
2 0.190848 0
3 0.646606 1
4 0.562591 0
5 0.409250 1
6 0.637074 0
7 0.946864 1
8 0.203656 0
9 0.276929 1
现在,我想按b列分组,并在一个箱线图中将两个组的分布进行箱线图绘制。我怎样才能做到这一点?
最佳答案
您可以使用by
的boxplot
参数。那是您要找的东西吗?
df.boxplot(column='a', by='b')
关于pandas - 按列分组,然后按 Pandas 索引进行箱线图绘制,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20680596/