我正在使用以下代码使用 randomforest
获取 gridsearchcv
的优化参数。
x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)
rfc = RandomForestClassifier(random_state=42, class_weight = 'balanced')
param_grid = {
'n_estimators': [200, 500],
'max_features': ['auto', 'sqrt', 'log2'],
'max_depth' : [4,5,6,7,8],
'criterion' :['gini', 'entropy']
}
k_fold = StratifiedKFold(n_splits=10, shuffle=True, random_state=0)
CV_rfc = GridSearchCV(estimator=rfc, param_grid=param_grid, cv= 10, scoring = 'roc_auc')
CV_rfc.fit(x_train, y_train)
print(CV_rfc.best_params_)
print(CV_rfc.best_score_)
现在,我想将调整后的参数应用于
X_test
。为此,我做了以下工作,pred = CV_rfc.decision_function(x_test)
print(roc_auc_score(y_test, pred))
但是,
decision_function
似乎不支持 randomforest
,因为我收到以下错误。有没有其他方法可以做到这一点?
如果需要,我很乐意提供更多详细信息。
最佳答案
如果您的目的是获得模型评分函数以便评分可用于 auc_roc_score
,那么您可以选择 predict_proba()
y_pred_proba = CV_rfc.predict_proba(x_test)
print(roc_auc_score(y_test, y_pred_proba[:,1]))
关于python - 如何在sklearn中的randomforest中获得决策函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55605681/