我有一个问题,我希望有一个相对简单的解决方案。我有一个数据框,每个唯一联系人有多个记录(见下面的“名称”)。我正在尝试按名称分组,并在缺少值的地方汇总这些值。

   name   id            email
0   bob  5.0              NaN
1   bob  NaN     test@foo.com
2  bill  3.0              NaN
3  bill  NaN  something@a.com

预期产出将是:
   name   id            email
0   bob  5.0     test@foo.com
1  bill  3.0     something@a.com

我试过旋转和再旋转几个不同的方法都没有用我能做这个吗?

最佳答案

您可以尝试:

df.groupby('name')[['id', 'email']].first()

#        id           email
#name
#bill   3.0 something@a.com
#bob    5.0    test@foo.com

如果您感兴趣,也可以在这里检查source code(根据它获取第一个非空值)。

关于python - Pandas -汇总行以填充丢失的数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42540529/

10-10 19:53
查看更多