我正在自学Pandas和Python,并试图找出如何用字符串替换一列充满整数的列。假设我有一个充满年龄的数据集,我想将它们分组到新列中的类别中。
年龄30至50岁之间的年龄段,以“中年”年龄段取代
年龄> 50岁,请替换为“较老”
最简单的方法是什么?
我已经研究了.apply和.replace对数据帧的处理方式,但是我感到困惑。我应该学习“ lambda”是什么吗?我应该先定义一个函数然后使用.apply函数,还是有一种更简单的方法?非常感谢。
1 62
2 47
3 34
最佳答案
您可以创建一个函数来确定年龄:
def check(age):
if age > 50:
return 'Old'
elif 30 <= age <= 50:
return 'Middle'
else:
return 'Young'
然后使用apply()对所有数据进行编码。
res = df.apply(check)
结果:
0 62
1 47
2 34
0 Old
1 Middle
2 Middle