我正在努力形成一棵像数据框的树,在父母的正下方有孩子排。我想做的是在合并object_id x parent_id和沿轴0串联之间的某些操作。
所以我要寻找的是下面代码段中隔行功能的实现。
In[1]: parents = pd.DataFrame({'object_id':[1,2],
'parent_id':[0,0],
'position': [1,2]})
In[2]: parents
Out[2] object_id parent_id position
0 1 0 1
1 2 0 2
In[3]: children = pd.DataFrame({'object_id':[3,4,5],
'parent_id':[1,1,2],
'position': [1,2,1]})
In[4]: children
Out[4]: object_id parent_id position
0 3 1 1
1 4 1 2
2 5 2 1
In[5]: interlace(parent, children, on=('object_id', 'parent_id'))
Out[5]: object_id parent_id position
0 1 0 1
1 3 1 1
2 4 1 2
3 2 0 1
4 5 2 1
在大熊猫中,有没有一种有效的方法?
我认为一个人可以做类似的事情
parents_with_children = []
for i, parentrow in parents.iteritems():
childrenrows = children[children.parent_id == parentrow.object_id]
parents_with_children.append(pd.concat([parentrow, childrenrows])
result = pd.concat(parents_with_children)
但是我觉得应该有一种更容易,更有效的方法来做到这一点。
编辑:具有相同级别和相同父级的行需要保持按其位置排序。
最佳答案
可能的解决方案:
children['sort_id']=children.parent_id
parents['sort_id']=parents.object_id
pd.concat([parents,children]).sort_values(['sort_id', 'parent_id']).drop('sort_id', 1)
关于python - 如何在父子关系上合并两个数据框(在concat和merge之间),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40727148/