我在数据框中有一个看起来像这样的列:

df['label']

['some_label', 'some_label', 'a_diff_label', 'a_diff_label',...]


我想将其转换为这样的内容:

[1,1,0,0,...]

最佳答案

您还可以使用LabelEncoder中的sklearn,如果需要,还可以将标签编码变回原来的格式。 (sklearn LabelEncoder documentation):

import pandas as pd
from sklearn import preprocessing

df = pd.DataFrame({'label': ['some_label', 'some_label', 'a_diff_label', 'a_diff_label']})

le = preprocessing.LabelEncoder()
df['label'] = le.fit_transform(df['label'])

关于python - 如何将 Pandas 数据框从基于字符串的分类列转换为数字表示形式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51605226/

10-11 02:46