我正在使用 python 进行一些机器学习。
我有一个包含 2000 个条目的 python nd 数组。每个条目都有关于某些主题的信息,最后有一个 bool 值来告诉我他们是否是吸血鬼。
数组中的每个条目如下所示:
[height(cm), weight(kg), stake aversion, garlic aversion, reflectance, shiny, IS_VAMPIRE?]
我的目标是根据上面显示的主题数据,能够给出一个新主题是吸血鬼的概率。
我已经使用 sklearn 为我做了一些机器学习:
clf = tree.DecisionTreeRegressor()
clf=clf.fit(X,Y)
print clf.predict(W)
其中 W 是新主题的数据数组。我编写的脚本返回 bool 值,但我希望它返回概率。我该如何修改它?
最佳答案
使用 DecisionTreeClassifier 而不是回归器,并使用 predict_proba
方法。或者,您可以使用逻辑回归(也可在 scikit learn 中使用。)
基本思想是这样的:
clf = tree.DecisionTreeClassifier()
clf=clf.fit(X,Y)
print clf.predict_proba(W)
关于python - 概率与机器学习,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19873624/