我有一些如下数据:
username, password, valid
kramer, abcd1234, 1
dan,123123123,0
如您所见,数据的字符可以是字符串。所以scikit-learn.RandomForestClassifier返回错误
ValueError: could not convert string to float: 'hEZ7P|N*Akem'
我正在考虑两种解决方案。
将字符串更改为浮点,因为它们可以用ASCII表示
找到另一个支持字符串功能的algothrim。
哪一个更好?你能给点建议吗?
最佳答案
我认为您将需要使用像一键编码这样的分类特征进行编码,因为您需要数字表示形式。查看此答案以了解更多
https://datascience.stackexchange.com/questions/5226/strings-as-features-in-decision-tree-random-forest
关于machine-learning - 随机森林机器是否学习支持字符串字符?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44804875/