我正在使用以下代码将字符串转换为数据集中的分类值。

data['weekday'] = pd.Categorical.from_array(data.weekday).labels

例如
index    weekday
0        Sunday
1        Sunday
2        Wednesday
3        Monday
4        Monday
5        Thursday
6        Tuesday

在对工作日进行编码后,我的数据集如下所示:
index    weekday
    0       3
    1       3
    2       6
    3       1
    4       1
    5       4
    6       5

我有什么办法可以知道周日已映射到3,周三已映射到6,依此类推?

最佳答案

最好的方法是使用sklearn库的标签编码器。

像这样:

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit(["paris", "paris", "tokyo", "amsterdam"])
list(le.classes_)
le.transform(["tokyo", "tokyo", "paris"])
list(le.inverse_transform([2, 2, 1]))

关于python - 有什么方法可以在Python Pandas 中获取标签编码器的映射?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42196589/

10-14 17:57