我有两个数据框。其中一项名为ENFORE,具有139个观测值:
citation Enfore
0170/0952 1
0175/0686 1
0184/0521 1
0183/0726 1
0178/0595 0
另一个数据框称为CITATIONS,具有668个观测值,也具有列引用,但不包含Enfore。 ENFORE中的所有引文都在CITATIONS数据框中。
我想在CITATIONS数据框中添加Enfore列,并用'X'填充ENFORE数据框中没有的观测值。
使用此代码的各种变体(合并和联接)
enfore_merged = pd.merge(enfore , harrington_citations, on = 'citation')
我无法创建上面描述的数据框。
最佳答案
您几乎在那里:
enfore_merged = harrington_citations.merge(enfore, how='left', on='citation')
enfore_merged['Enfore'] = enfore_merged['Enfore'].fillna('X')
关于python - 将缺失观测值的变量添加到现有 Pandas df中,而不会丢失较大df中的观测值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58780260/