我不知道如何调用此操作,因此我无法真正使用Google进行搜索,但这是我想要做的事情:
我有这个数据框:
df = pd.DataFrame({"name": ["A", "B", "B", "B", "A", "A", "B"], "value":[3, 1, 2, 0, 5, 2, 3]})
df
name value
0 A 3
1 B 1
2 B 2
3 B 0
4 A 5
5 A 2
6 B 3
我想将其放在
df.name
上并在max
上应用df.values
函数,但前提是名称是按顺序排列的。所以我想要的结果如下:df.groupby_sequence("name")["value"].agg(max)
name value
0 A 3
1 B 2
2 A 5
3 B 3
任何线索如何做到这一点?
最佳答案
使用pandas
,您可以使用(df.name!=df.name.shift()).cumsum()
将名称在行与行之间更改时进行分组,基本上将连续的名称分组在一起:
>>> df.groupby((df.name!=df.name.shift()).cumsum()).max().reset_index(drop=True)
name value
0 A 3
1 B 2
2 A 5
3 B 3