h2o检查点实际上是做什么的?模型创建时说

gbm_continued = H2OGradientBoostingEstimator(checkpoint= gbm_orig.model_id, ntrees = 50, seed = 1234)


意味着如果我们不对任何新数据进行训练,gbm_continued将具有与gbm_orig相同的参数和预测性能?

docs,说“这将建立一个新模型作为先前生成的模型的延续”,但是我对“延续”的实际含义感到困惑。一个解释将不胜感激。谢谢

最佳答案

关键参数是ntrees(对于深度学习模型,为epochs)。我将引用我自己的书(《 H2O的实践机器学习》,第103页):


  指定时期或树数时,请指定
  如果您是从头开始的话,可以进行所需的训练,而不是想要多少个额外的纪元或树木。


因此,在您的情况下,如果您的原始模型是由50棵树构成的,那么您的新模型将只做复制现有模型的工作。但是,如果您的原始模型是使用ntrees = 20创建的,而新模型将其用作检查点但使用了ntrees = 50,则它将为该模型添加30多棵树。

有些参数必须保持不变,但有些可以更改。例如。您可能会降低学习速度。

08-24 14:23