我正在尝试从scikit-learn集成中打印出森林的决策树:例如,对于DecisionTreeClassifier,我将使用:
from sklearn import tree
clf = tree.DecisionTreeClassifier( criterion ='entropy', max_depth = 3,
min_samples_leaf =
clf = clf.fit( X_train, y_train) #Input this to analyze the training set.
import pydot, StringIO
dot_data = StringIO.StringIO()
tree.export_graphviz( clf, out_file = dot_data,
feature_names =[' age', 'sex', 'first_class', 'second_class', 'third_class'])
graph = pydot.graph_from_dot_data( dot_data.getvalue())
graph.write_png('visualtree.png')
from IPython.core.display import Image
Image( filename =visualtree.png')
我为随机森林回归算法尝试了类似的方法(请参见下文,并出现错误)
# Fit regression model
from sklearn.ensemble import RandomForestRegressor
rfr_1 = RandomForestRegressor(n_estimators=10, max_depth=5)
rfr_1.fit(X, y)
from sklearn.ensemble import*
import pydot, StringIO
dot_data = StringIO.StringIO()
ensemble.export_graphviz( rf1, out_file = dot_data,
feature_names =[' Temperature', 'Translator Bacteria'])
graph = pydot.graph_from_dot_data( dot_data.getvalue())
graph.write_png('fish.png')
from IPython.core.display import Image
图片(filename ='fish.png')
在第45行的文件“randomforestregressor.py”中
ensemble.export_graphviz(rf1,out_file = dot_data,
NameError:未定义名称“合奏”
我将如何完成?谢谢!
最佳答案
该错误消息非常明显:File "randomforestregressor.py", line 45, in ensemble.export_graphviz( rf1, out_file = dot_data,NameError: name 'ensemble' is not defined
您可以在脚本第45行中访问名为ensemble
的变量,但从未定义过此类变量。在您的情况下,您可能希望该变量指向sklearn.ensemble
包:from sklearn import ensemble
但是,如果执行此操作,则可能会收到AttributeError
,因为sklearn.ensemble
包不具有export_graphviz
功能。
相反,您可能想要做的是通过遍历rfr_1.estimators_
列表的元素并在每棵树上调用export_graphviz
包的sklearn.tree
方法,在森林中的每棵树上生成一张图像。
然而,实际上,展示森林的树木通常是没有用的。从业人员通常使用数百或数千棵树木 build 随机森林,以获得良好的预测准确性。在这种情况下,肉眼检查许多树木是不切实际的。