我有两个数据框



这些数据帧中的一个具有重复的索引,我想将它们与另一个数据帧合并,而不是这样。例如

数据框I =

[ index  column1]
leb       Lebanon
iso        iso1
CAN         Canda


DataFrame I2 =

[ index  column1]
leb       ra
CAN        ba
CAN         gell


我想合并它们

数据框Itot =

DataFrame I2=
[ index  column1     column2]
leb       ra          Lebanon
CAN        ba           Canada
CAN         gell       canada


在Stata中,这是多对一合并,如
http://www.stata.com/manuals13/dmerge.pdf第7页。

最佳答案

考虑这个DataFrame

  df = pd.DataFrame({'Year': [2010,2009,2008],
                       'population_A': ['101597.0', '101416.0', '101342.0'],
                       'Country':['Aruba', 'Aruba', 'Aruba']})

    df = df.set_index(['Country'])
    df


将另一个非重复数据帧视为

df1 = pd.DataFrame({'Country':['Aruba','Afghanistan','Africa','Lebanon'], 'iso3c':['ABW','AFG','AFR','LEB']})
df1 = df1.set_index(['Country'])
df1


为此,我们需要第一个数据框具有与国家/地区不同的索引,例如id 0,1,2,...

df.reset_index(level=0, inplace=True)
df
df.join(df1, on='Country')


就是这个

关于python - 如何合并具有重复索引条目的数据框和具有唯一索引条目的数据框?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36119073/

10-11 07:39
查看更多