我正在尝试使用h2o.automl()进行训练。但是培训因超时而退出。我知道max_runtime_secs可以设置为更高的数字。但是,如果我们可以训练1小时,然后将其保存在某个地方,那就太好了。第二天从第一天剩下的地方再次训练它。

怎么做 ?

我已经尝试通过设置project_name-但退出时不会保存任何内容。因此,如果我们关闭计算机并重新启动,则没有任何用处。

我为此使用了以下代码:

library( h2o )

h2o.init( nthreads = -1, max_mem_size = '10240m' )

train = h2o.importFile( 'train.csv' )

automl_model = h2o.automl( y = 'outcome', training_frame = train, nfolds = 3, max_runtime_secs = 1800,

                           project_name = 'automl_aus_tennis' )


链接到train.csv:http://www.mediafire.com/file/qj7yiju15ncgnax/train.csv

最佳答案

您可以使用相同的h2o.automl()和不同的种子重复运行project_name,以构建其他模型并将它们添加到相同的leaderboard中。我一直都这样做。

有一个pull request,应该很快就可以使用,它允许您指定不运行的算法。这使您可以调整在每次AutoML运行中执行哪些超参数搜索。

您需要保持h2o-3实例运行以实现您的目标,因为您当前无法将AutoML运行状态保存到磁盘并将其加载到新的h2o-3实例中,或添加从磁盘加载的模型放入leaderboard。这些将是有用的功能请求。 :-)

关于r - 如何迭代训练H2O Automl模型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48140279/

10-12 18:47