我有一个pandas数据框,我想获取一列中其他两个值的每种组合的平均值。
也就是说,如果我有一个像这样的数据框:
Temperature Apple Banana
50 MacIntosh Gran Michel
28 Jazz Cavendish
4 MacIntosh Canvenish
100 MacIntosh Gran Michel
我想要这样的总结:
MacIntosh Gran Michel 75
Jazz Cavendish 28
MacIntosh Cavendish 4
最佳答案
>>> df.groupby(['Apple', 'Banana'], as_index=False).mean()
Apple Banana Temperature
0 Jazz Cavendish 28
1 MacIntosh Cavendish 4
2 MacIntosh Gran Michel 75
或者,如果您想要一个新索引:
>>> df.groupby(['Apple', 'Banana']).mean()
Temperature
Apple Banana
Jazz Cavendish 28
MacIntosh Cavendish 4
Gran Michel 75