我有一个包含两列的表格,我想将具有相同ID的文本合并
import pandas as pd
df = DataFrame({'id':[101453,101465,101478,101453,101465,101465], 'text' :['this','is','a','test','string','one']})
我需要这样的结果:
df = DataFrame({'id':[101453,101465,101478], 'text':['this test','is string one','a']})
最佳答案
将groupby
与apply
join
一起使用:
print (df.groupby('id')['text'].apply(' '.join).reset_index())
id text
0 101453 this test
1 101465 is string one
2 101478 a