我对python完全陌生。我有两个具有相同数据集的数据框,但一个是输入,一个是输出。

所以,这是我的输入数据框

Document_ID OFFSET  PredictedFeature
    0         0            2000
    0         8            2000
    0         16           2200
    0         23           2200
    0         30           2200
    1          0            2100
    1          5            2100
    1          7            2100


所以在这里,我将此作为我的ml-model的输入。它只给我这种格式的输出。

现在我的输出看起来像

  Document_ID    OFFSET   PredictedFeature
        0         0            2000
        0         8            2000
        0         16           2100
        0         23           2100
        0         30           2200
        1          0           2000
        1          5           2000
        1          7           2100


现在,在这两个数据框中,我想做的是

对于该ID,对于该OFFSET,输入功能与输出功能相同。如果是,那么我想在新列中添加true作为值,否则将添加false值。

现在,如果我们在示例数据中看到

for ID 0 , for offset 16 the input feature is 2200 and output feature is 2100 so it is a false.


有人可以帮我吗?任何事情都会有所帮助。

最佳答案

如果两个DataFrame之间的索引值相同,并且前2列的值相同,则使用:

inputdf['new'] = inputdf['PredictedFeature'] == outputdf['PredictedFeature']

关于python - 根据数据框中的ID比较两个数据框列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58407082/

10-12 21:22
查看更多