我有这样的数据:

df = pd.DataFrame( {
    'ID': [1,1,2,3,3,3,4],
    'SOME_NUM': [8,10,2,4,0,5,1]
} );

df
    ID    SOME_NUM
0   1     8
1   1     10
2   2     2
3   3     4
4   3     0
5   3     5
6   4     1

我想通过ID列分组,同时将某个最大值保留为单独的列。这在SQL中很简单:
SELECT ID,
       MAX(SOME_NUM)
FROM DF
GROUP BY ID;

但是我很难找到等效的Python代码。看来这应该很容易。有人有办法吗?
预期结果:
    new_df
    ID    SOME_NUM
0   1     10
1   2     2
2   3     5
6   4     1

最佳答案

看看你是如何使用熊猫的。。。使用内置的groupby功能

df.groupby("ID").max()

07-25 23:42
查看更多