我正在自学Pandas和Python,并试图找出如何用字符串替换一列充满整数的列。假设我有一个充满年龄的数据集,我想将它们分组到新列中的类别中。
年龄30至50岁之间的年龄段,以“中年”年龄段取代
年龄> 50岁,请替换为“较老”

最简单的方法是什么?

我已经研究了.apply和.replace对数据帧的处理方式,但是我感到困惑。我应该学习“ lambda”是什么吗?我应该先定义一个函数然后使用.apply函数,还是有一种更简单的方法?非常感谢。

1 62
2 47
3 34

最佳答案

您可以创建一个函数来确定年龄:

def check(age):
    if age > 50:
        return 'Old'
    elif 30 <= age <= 50:
        return 'Middle'
    else:
        return 'Young'


然后使用apply()对所有数据进行编码。

res = df.apply(check)


结果:

0    62
1    47
2    34

0       Old
1    Middle
2    Middle

08-20 04:14
查看更多