import pandas as pd

df1 = pd.DataFrame({'date': ['2015-01-01', '2015-01-10', '2015-01-11', '2015-01-12'], 'a': [1,2,3,4]})

df2 = pd.DataFrame({'date': ['2015-01-01', '2015-01-05', '2015-01-11'], 'b': [10,20,30]})

df = df1.merge(df2, on=['date'], how='outer')

df = df.sort_values('date')

print df


“喜欢磁性的东西”可能不是标题的好表达。我将在下面解释。

我希望df2中的记录匹配日期大于或等于df2的df1的第一条记录。例如,我希望df2的“ 2015-01-05”与df1的“ 2015-01-10”匹配。

我无法通过简单地以innerouterleft方式合并它们来实现。虽然,上述结果非常接近我想要的结果。

     a        date     b
0  1.0  2015-01-01  10.0
4  NaN  2015-01-05  20.0
1  2.0  2015-01-10   NaN
2  3.0  2015-01-11  30.0
3  4.0  2015-01-12   NaN


如何通过我的工作或从头开始以其他方式实现这一目标?

     a        date     b
0  1.0  2015-01-01  10.0
1  2.0  2015-01-10  20.0
2  3.0  2015-01-11  30.0
3  4.0  2015-01-12   NaN

最佳答案

确保您的日期是日期

df1.date = pd.to_datetime(df1.date)
df2.date = pd.to_datetime(df2.date)


numpy
np.searchsorted

ilocs = df1.date.values.searchsorted(df2.date.values)
df1.loc[df1.index[ilocs], 'b'] = df2.b.values

df1

   a       date     b
0  1 2015-01-01  10.0
1  2 2015-01-10  20.0
2  3 2015-01-11  30.0
3  4 2015-01-12   NaN


pandas
pd.merge_asof让您真正接近

pd.merge_asof(df1, df2)

   a       date   b
0  1 2015-01-01  10
1  2 2015-01-10  20
2  3 2015-01-11  30
3  4 2015-01-12  30

关于python - Pandas 像磁性物体一样合并DataFrame,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41869879/

10-12 19:40