熊猫执行以下操作的方式是什么?

data.groupby('id').duration.max().index[data.groupby('id').duration.max() > 365]


我不想按ID分组,然后使用组过滤并在条件为真的情况下返回ID。

使用group.filter函数返回原始数据帧。

最佳答案

您可以重写代码-聚合函数boolean indexingSeries中的max称为index

s = data.groupby('id').duration.max()
idx = s.index[s > 365]
#alternative
#idx = s[s > 365].index


您还可以检查Series的过滤值:

print(s[s > 365])


但是如果要按组的DataFrame值过滤原始max值,请添加GroupBy.transform以返回Series,其大小与原始DataFrame相同:

data[data.groupby('id').duration.transform('max') > 365]

关于python - Pandas groupby键,然后根据组和返回键进行过滤,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53515672/

10-10 00:38
查看更多