我有一个问题,我希望有一个相对简单的解决方案。我有一个数据框,每个唯一联系人有多个记录(见下面的“名称”)。我正在尝试按名称分组,并在缺少值的地方汇总这些值。
name id email
0 bob 5.0 NaN
1 bob NaN test@foo.com
2 bill 3.0 NaN
3 bill NaN something@a.com
预期产出将是:
name id email
0 bob 5.0 test@foo.com
1 bill 3.0 something@a.com
我试过旋转和再旋转几个不同的方法都没有用我能做这个吗?
最佳答案
您可以尝试:
df.groupby('name')[['id', 'email']].first()
# id email
#name
#bill 3.0 something@a.com
#bob 5.0 test@foo.com
如果您感兴趣,也可以在这里检查source code(根据它获取第一个非空值)。
关于python - Pandas -汇总行以填充丢失的数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42540529/