我有一个pandas数据框,我想获取一列中其他两个值的每种组合的平均值。

也就是说,如果我有一个像这样的数据框:

 Temperature   Apple      Banana
 50            MacIntosh  Gran Michel
 28            Jazz       Cavendish
 4             MacIntosh  Canvenish
 100           MacIntosh  Gran Michel


我想要这样的总结:

 MacIntosh Gran Michel 75
 Jazz      Cavendish   28
 MacIntosh Cavendish   4

最佳答案

>>> df.groupby(['Apple', 'Banana'], as_index=False).mean()
       Apple       Banana  Temperature
0       Jazz    Cavendish           28
1  MacIntosh    Cavendish            4
2  MacIntosh  Gran Michel           75


或者,如果您想要一个新索引:

>>> df.groupby(['Apple', 'Banana']).mean()
                       Temperature
Apple     Banana
Jazz      Cavendish             28
MacIntosh Cavendish              4
          Gran Michel           75

10-06 14:17