R包randomForest报告表示林中每个树的均方误差。但是,我需要对数据中每个情况的置信度进行度量。由于randomForest通过对单个树的预测取平均值来计算个案预测,因此我想也应该有可能计算个案标准误差,从而计算置信区间。可以使用输出randomForest对象(如果这样:如何?)来完成此操作,还是必须深入研究源代码?
最佳答案
无需深入研究源代码。您只需要阅读文档。 ?predict.randomForest
声明其参数之一称为predict.all
:
因此,将其设置为TRUE
将为每种情况,每棵树保留一个预测,然后可以使用该预测来计算每种情况下的标准误差。
最近,我被Stefan Wager,Trevor Hastie和Brad Efron得知this论文,该论文对随机森林(和其他袋装预测器)产生的预测进行标准误差的概念进行了更为严格的研究。
关于R : Is there a possibility of calculating casewise confidence intervals?中的randomForest,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14709711/