Dataframe:
one two
a 1 x
b 1 y
c 2 y
d 2 z
e 3 z
grp = DataFrame.groupby('one')
grp.agg(lambda x: ???) #or equivalent function
来自grp.agg的所需输出:
one two
1 x|y
2 y|z
3 z
在集成数据帧之前,我的agg函数是
"|".join(sorted(set(x)))
。理想情况下,我希望组中具有任意数量的列,并且agg为每个列项目返回"|".join(sorted(set())
,就像上面的两个一样。我也尝试过np.char.join()
。爱 Pandas ,它使我从800线复杂的程序带到了缩放公园中的400线步行。谢谢 :)
最佳答案
你是如此亲密:
In [1]: df.groupby('one').agg(lambda x: "|".join(x.tolist()))
Out[1]:
two
one
1 x|y
2 y|z
3 z
扩展答案以处理排序并仅接受集合:
In [1]: df = DataFrame({'one':[1,1,2,2,3], 'two':list('xyyzz'), 'three':list('eecba')}, index=list('abcde'), columns=['one','two','three'])
In [2]: df
Out[2]:
one two three
a 1 x e
b 1 y e
c 2 y c
d 2 z b
e 3 z a
In [3]: df.groupby('one').agg(lambda x: "|".join(x.order().unique().tolist()))
Out[3]:
two three
one
1 x|y e
2 y|z b|c
3 z a
关于python pandas自定义agg函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14246817/