Panadas-每列的总和基于第一列
我有一个文本文件,其中包含表和其他3个列,分别指示“选择”,“更新”和“插入”。我想按表格进行分组,并在末尾对各列的总和进行总计。
df=data.groupby(['Table'])
print df.groupby(['Table'])["Select","Update","Insert"].agg('sum')
Text file has data in this format
Table Select Update Insert
A 10 8 5
B 12 2 0
C 10 2 4
B 19 3 1
D 13 0 5
A 11 7 3
Expected output
Table Select Update Insert
A 21 15 8
B 31 5 1
C 10 2 4
D 13 0 5
Total 75 22 18
带有sum的df.groupby不能正确地为每一列聚合数据。如果聚合仅在一个列上完成,那很好,但是我的终端上的输出都混乱了。
感谢您的帮助!
最佳答案
您可以尝试:df.groupby(by='Table').sum()
用于汇总表:
Select Update Insert
Table
A 21 15 8
B 31 5 1
C 10 2 4
D 13 0 5
而
df.groupby(by='Table').sum().sum()
总计:Select 75
Update 22
Insert 18
dtype: int64
关于python - Pandas数据框-基于组的每一列的总和,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56822646/