在多数的机器学习比赛中,给出的标签都是非数字化的,所以我们需要对其进行转换。代码如下:
from sklearn import preprocessing
feature = [[0,1], [1,1], [0,0], [1,0]]
label= ['yes', 'no', 'yes', 'no']
lb = preprocessing.LabelBinarizer() #构建一个转换对象
Y = lb.fit_transform(label)
re_label = lb.inverse_transform(Y)
print(Y)
print(re_label)
输出
[[1]
[0]
[1]
[0]]
['yes' 'no' 'yes' 'no']
转换函数将字符串label进行数字化,数字范围从0开始,并且将label转换为了一个列向量。最后在ML任务完成之后,输出的时候需要还原之前的label,因此使用函数inverse_transform()。
————————————————
原文链接:https://blog.csdn.net/twt520ly/article/details/79538329