h2o
检查点实际上是做什么的?模型创建时说
gbm_continued = H2OGradientBoostingEstimator(checkpoint= gbm_orig.model_id, ntrees = 50, seed = 1234)
意味着如果我们不对任何新数据进行训练,gbm_continued将具有与gbm_orig相同的参数和预测性能?
docs,说“这将建立一个新模型作为先前生成的模型的延续”,但是我对“延续”的实际含义感到困惑。一个解释将不胜感激。谢谢
最佳答案
关键参数是ntrees
(对于深度学习模型,为epochs
)。我将引用我自己的书(《 H2O的实践机器学习》,第103页):
指定时期或树数时,请指定
如果您是从头开始的话,可以进行所需的训练,而不是想要多少个额外的纪元或树木。
因此,在您的情况下,如果您的原始模型是由50棵树构成的,那么您的新模型将只做复制现有模型的工作。但是,如果您的原始模型是使用ntrees = 20
创建的,而新模型将其用作检查点但使用了ntrees = 50
,则它将为该模型添加30多棵树。
有些参数必须保持不变,但有些可以更改。例如。您可能会降低学习速度。