我有一个表,该表的列对应于教育程度:"phd", "undergrad",等等。

我想将这些功能更改为0, 1, 2....。为了将数据用作机器学习算法的输入。

Python中有没有一种方法可以将这些字符串特征自动映射为整数?

最佳答案

如果要具有相同的序列号,则可以使用enumerate

lista = [ "phd", "undergrad", "etc"]
>>> [i for i in enumerate(lista)]
[(0, 'phd'), (1, 'undergrad'), (2, 'etc')]

10-04 16:22