我有两个数据框。其中一项名为ENFORE,具有139个观测值:

citation    Enfore
0170/0952   1
0175/0686   1
0184/0521   1
0183/0726   1
0178/0595   0


另一个数据框称为CITATIONS,具有668个观测值,也具有列引用,但不包含Enfore。 ENFORE中的所有引文都在CITATIONS数据框中。

我想在CITATIONS数据框中添加Enfore列,并用'X'填充ENFORE数据框中没有的观测值。

使用此代码的各种变体(合并和联接)

enfore_merged = pd.merge(enfore , harrington_citations, on = 'citation')


我无法创建上面描述的数据框。

最佳答案

您几乎在那里:

enfore_merged = harrington_citations.merge(enfore, how='left', on='citation')
enfore_merged['Enfore'] = enfore_merged['Enfore'].fillna('X')

关于python - 将缺失观测值的变量添加到现有 Pandas df中,而不会丢失较大df中的观测值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58780260/

10-12 22:32