假设我有一个看起来像这样的数据框:

A  B  C
X  U  500
X  S  300
X  T  200
Y  F  20
Y  G  980
Z  L  400


我想在A列中使用特定的值,因此{X,Y,Y},并基于这些值,我想获取C行的总和并将其输出到新的数据帧中。我的新数据框应该像这样

A  B
X  1000
Y  1000
Z  400


本质上是按A列中的名称对值进行分组,从A中的每个值中获取C的总和,并创建一个新数据框,其名称由A列中指定,名称来自C列。

我需要它自己获取这些值,因为想象我的数据框在A列中有200行和80个不同的值。

最佳答案

采用:

df = df.groupby('A', as_index=False)['B'].sum()


要么:

df = df.groupby('A')['B'].sum().reset_index()

10-08 09:11
查看更多