我正在使用以下代码将字符串转换为数据集中的分类值。
data['weekday'] = pd.Categorical.from_array(data.weekday).labels
例如
index weekday
0 Sunday
1 Sunday
2 Wednesday
3 Monday
4 Monday
5 Thursday
6 Tuesday
在对工作日进行编码后,我的数据集如下所示:
index weekday
0 3
1 3
2 6
3 1
4 1
5 4
6 5
我有什么办法可以知道周日已映射到3,周三已映射到6,依此类推?
最佳答案
最好的方法是使用sklearn库的标签编码器。
像这样:
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit(["paris", "paris", "tokyo", "amsterdam"])
list(le.classes_)
le.transform(["tokyo", "tokyo", "paris"])
list(le.inverse_transform([2, 2, 1]))
关于python - 有什么方法可以在Python Pandas 中获取标签编码器的映射?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42196589/