我正在使用以下代码使用 randomforest 获取 gridsearchcv 的优化参数。

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)
rfc = RandomForestClassifier(random_state=42, class_weight = 'balanced')
param_grid = {
    'n_estimators': [200, 500],
    'max_features': ['auto', 'sqrt', 'log2'],
    'max_depth' : [4,5,6,7,8],
    'criterion' :['gini', 'entropy']
}
k_fold = StratifiedKFold(n_splits=10, shuffle=True, random_state=0)
CV_rfc = GridSearchCV(estimator=rfc, param_grid=param_grid, cv= 10, scoring = 'roc_auc')
CV_rfc.fit(x_train, y_train)
print(CV_rfc.best_params_)
print(CV_rfc.best_score_)

现在,我想将调整后的参数应用于 X_test 。为此,我做了以下工作,
pred = CV_rfc.decision_function(x_test)
print(roc_auc_score(y_test, pred))

但是,decision_function 似乎不支持 randomforest,因为我收到以下错误。



有没有其他方法可以做到这一点?

如果需要,我很乐意提供更多详细信息。

最佳答案

如果您的目的是获得模型评分函数以便评分可用于 auc_roc_score ,那么您可以选择 predict_proba()

y_pred_proba = CV_rfc.predict_proba(x_test)
print(roc_auc_score(y_test, y_pred_proba[:,1]))

关于python - 如何在sklearn中的randomforest中获得决策函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55605681/

10-12 21:12