本文介绍了使用公式界面时有问题的随机森林训练运行时的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
从 http://www中运行随机森林示例. kaggle.com/c/icdar2013-gender-prediction-from-handwriting/data ,以下行:
forest_model <- randomForest(as.factor(male) ~ ., data=train, ntree=10000)
需要几个小时(不确定它是否会结束,但是该过程确实可行).
takes hours (not sure whether it will ever end, but the process does seems to work) .
数据集具有1128行和约7000个变量.
The data set has 1128 rows and ~7000 variables.
是否可以估计随机森林"训练的完成时间?我可以通过某种方式对R进行分析以获得更多信息吗?
Is it possible to estimate when the Random Forest training will finish? Can I profile R somehow to get more information?
推荐答案
控制融合的一个想法是将do.trace
用于详细模式
One idea, to control the convergence is to use the do.trace
for a verbose mode
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,
+ proximity=TRUE,do.trace=TRUE)
ntree OOB 1 2 3
1: 8.62% 0.00% 9.52% 15.00%
2: 5.49% 0.00% 3.45% 13.79%
3: 5.45% 0.00% 5.41% 11.76%
4: 4.72% 0.00% 4.88% 9.30%
5: 5.11% 0.00% 6.52% 8.89%
6: 5.56% 2.08% 6.25% 8.33%
7: 4.76% 0.00% 6.12% 8.16%
8: 5.41% 0.00% 8.16% 8.16%
.......
这篇关于使用公式界面时有问题的随机森林训练运行时的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!