我想从决策树/随机森林中提取有用的规则,以便开发一种更适用的方式来处理规则和预测。因此,我需要一个使规则更易于理解的应用程序。

我有什么建议(例如可视化,验证方法等)?

最佳答案

至于为什么选择了特定的拆分,答案始终是:“因为拆分创建了目标变量的最佳拆分。”

您引用了scikit-learn...。继续阅读scikit-learn的documentation on Decision Trees...。其中有一个示例,正是您在页面中间所要的。看起来像这样:

 

生成该图的代码也位于:

from sklearn.datasets import load_iris
from sklearn import tree
iris = load_iris()
clf = tree.DecisionTreeClassifier()
clf = clf.fit(iris.data, iris.target)
from sklearn.externals.six import StringIO
with open("iris.dot", 'w') as f:
f = tree.export_graphviz(clf, out_file=f)


还有其他几种图形表示,以及随附的代码:




SKL文档通常很棒并且非常有用。

希望这可以帮助!

关于r - 如何使决策树规则更易于理解?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31320286/

10-12 19:51