熊猫执行以下操作的方式是什么?
data.groupby('id').duration.max().index[data.groupby('id').duration.max() > 365]
我不想按ID分组,然后使用组过滤并在条件为真的情况下返回ID。
使用group.filter函数返回原始数据帧。
最佳答案
您可以重写代码-聚合函数boolean indexing
和Series
中的max
称为index
:
s = data.groupby('id').duration.max()
idx = s.index[s > 365]
#alternative
#idx = s[s > 365].index
您还可以检查
Series
的过滤值:print(s[s > 365])
但是如果要按组的
DataFrame
值过滤原始max
值,请添加GroupBy.transform
以返回Series
,其大小与原始DataFrame
相同:data[data.groupby('id').duration.transform('max') > 365]
关于python - Pandas groupby键,然后根据组和返回键进行过滤,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53515672/