我有一个数据框,如下所示
col1 col2 col3
0 a d 0
1 b e 1
2 c f 0
3 x t 1
.................
我想将值为1的col3更改为col2中的对应值
结果将是
col1 col2 col3
0 a d 0
1 b e e
2 c f 0
3 x t t
.................
df[['col1','col2','col3']].applymap(lambda x: df['col2'] if x==1 else x)
上面给出了错误
有人知道如何用熊猫吗?
最佳答案
采用:
df.loc[df.col3 == 1, 'col3'] = df.col2
要么:
df.col3 = df.col3.mask(df.col3 == 1, df.col2)
#df.col3 = df.col3.where(df.col3 != 1, df.col2)
#df.col3 = np.where(df.col3 == 1, df.col2, df.col3)
print (df)
col1 col2 col3
0 a d 0
1 b e e
2 c f 0
3 x t t
编辑:
apply + lambda
的解决方案较慢:df = df.apply(lambda x: x['col2'] if x['col3']==1 else x, axis=1)
时间:
#[40000 rows x 3 columns]
df = pd.concat([df] * 10000, ignore_index=True)
In [42]: %timeit df.col3 = np.where(df.col3 == 1, df.col2, df.col3)
100 loops, best of 3: 3.97 ms per loop
In [43]: %timeit df.loc[df.col3 == 1, 'col3'] = df.col2
100 loops, best of 3: 6.81 ms per loop
In [44]: %timeit df.col3 = df.col3.mask(df.col3 == 1, df.col2)
100 loops, best of 3: 4.95 ms per loop
In [45]: %timeit df.col3 = df.col3.where(df.col3 != 1, df.col2)
100 loops, best of 3: 4.8 ms per loop
In [47]: %timeit df.apply(lambda x: x['col2'] if x['col3']==1 else x, axis=1)
1 loop, best of 3: 3.39 s per loop
关于python - 将值从 Pandas 的另一列更改为相应的值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48820989/