我有这样的数据:
df = pd.DataFrame( {
'ID': [1,1,2,3,3,3,4],
'SOME_NUM': [8,10,2,4,0,5,1]
} );
df
ID SOME_NUM
0 1 8
1 1 10
2 2 2
3 3 4
4 3 0
5 3 5
6 4 1
我想通过ID列分组,同时将某个最大值保留为单独的列。这在SQL中很简单:
SELECT ID,
MAX(SOME_NUM)
FROM DF
GROUP BY ID;
但是我很难找到等效的Python代码。看来这应该很容易。有人有办法吗?
预期结果:
new_df
ID SOME_NUM
0 1 10
1 2 2
2 3 5
6 4 1
最佳答案
看看你是如何使用熊猫的。。。使用内置的groupby功能
df.groupby("ID").max()