假设我有一个看起来像这样的数据框:
A B C
X U 500
X S 300
X T 200
Y F 20
Y G 980
Z L 400
我想在A列中使用特定的值,因此{X,Y,Y},并基于这些值,我想获取C行的总和并将其输出到新的数据帧中。我的新数据框应该像这样
A B
X 1000
Y 1000
Z 400
本质上是按A列中的名称对值进行分组,从A中的每个值中获取C的总和,并创建一个新数据框,其名称由A列中指定,名称来自C列。
我需要它自己获取这些值,因为想象我的数据框在A列中有200行和80个不同的值。
最佳答案
采用:
df = df.groupby('A', as_index=False)['B'].sum()
要么:
df = df.groupby('A')['B'].sum().reset_index()