我将GridSearchCV与管道一起使用,如下所示:
grid = GridSearchCV(
Pipeline([
('reduce_dim', PCA()),
('classify', RandomForestClassifier(n_jobs = -1))
]),
param_grid=[
{
'reduce_dim__n_components': range(0.7,0.9,0.1),
'classify__n_estimators': range(10,50,5),
'classify__max_features': ['auto', 0.2],
'classify__min_samples_leaf': [40,50,60],
'classify__criterion': ['gini', 'entropy']
}
],
cv=5, scoring='f1')
grid.fit(X,y)
现在如何从
components
模型检索PCA详细信息,例如explained_variance
和grid.best_estimator_
?此外,我还想使用pickle将
best_estimator_
保存到文件中,然后再加载它。如何从已加载的估算器中检索PCA详细信息?我怀疑会和上面一样。 最佳答案
grid.best_estimator_
用于访问具有最佳参数的管道。
现在使用named_steps[]
attribute访问管道的内部估计量。
因此,grid.best_estimator_.named_steps['reduce_dim']
将为您提供pca
对象。现在,您可以简单地使用它来访问此pca对象的components_
和explained_variance_
服装,如下所示:grid.best_estimator_.named_steps['reduce_dim'].components_
grid.best_estimator_.named_steps['reduce_dim'].explained_variance_
关于python - sklearn-如何从传递给GridSearchCV的管道中检索PCA组件并解释差异,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46800147/