我有以下数据框:
Y = list(range(5))
Z = np.full(5, np.nan)
df = pd.DataFrame(dict(ColY = Y, ColZ = Z))
print(df)
ColY ColZ
0 0 NaN
1 1 NaN
2 2 NaN
3 3 NaN
4 4 NaN
这本字典:
Dict = {
0 : 1,
1 : 2,
2 : 3,
3 : 2,
4 : 1
}
如果通过Dict的ColY的对应值是2,我想用“ ok”填充ColZ。因此,我想要以下数据框:
ColY ColZ
0 0 NaN
1 1 ok
2 2 NaN
3 3 ok
4 4 NaN
我尝试了以下脚本:
df['ColZ'] = df['ColZ'].apply(lambda x : "ok" if Dict[x['ColY']] == 2 else Dict[x['ColY']])
我有这个错误:
TypeError: 'float' object is not subscriptable
你知道为什么吗 ?
最佳答案
将numpy.where
与Series.map
一起用于新系列,以便通过Series.eq
(==
)进行比较:
df['ColZ'] = np.where(df['ColY'].map(Dict).eq(2), 'ok', np.nan)
print(df)
ColY ColZ
0 0 nan
1 1 ok
2 2 nan
3 3 ok
4 4 nan
详情:
print(df['ColY'].map(Dict))
0 1
1 2
2 3
3 2
4 1
Name: ColY, dtype: int64
您的解决方案应使用
.get
更改以返回一些默认值,如果不匹配,则在此处np.nan
:df['ColZ'] = df['ColY'].apply(lambda x : "ok" if Dict.get(x, np.nan) == 2 else np.nan)
编辑:对于使用
df['ColZ']
值的集合,请使用:Y = list(range(5))
Z = list('abcde')
df = pd.DataFrame(dict(ColY = Y, ColZ = Z))
print(df)
Dict = {
0 : 1,
1 : 2,
2 : 3,
3 : 2,
4 : 1
}
df['ColZ1'] = np.where(df['ColY'].map(Dict).eq(2), 'ok', df['ColZ'])
df['ColZ2'] = df.apply(lambda x : "ok" if Dict.get(x['ColY'], np.nan) == 2
else x['ColZ'], axis=1)
print (df)
ColY ColZ ColZ1 ColZ2
0 0 a a a
1 1 b ok ok
2 2 c c c
3 3 d ok ok
4 4 e e e
关于python - Pandas 适用,“ float ”对象不可下标,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60002423/