如何将R randomForest包与观测砝码一起使用?我知道此程序包中没有这样的选项。我有两个问题:


使用randomForest软件包可以解决此问题吗?现在,我将从权重作为概率的数据中抽取样本,以便至少可以模拟它:

m = dim(data)[1]
sample(data, m, replace=TRUE, prob=weights)


它的工作原理还有其他(更好)的解决方案吗?
randomForest软件包是否有替代品?我找到了party程序包(cforest),但是在内存管理方面很糟糕(或者我不能像使用randomForest程序包那样使用它)。我有大约200k观察值和30-40个变量。


编辑:

抱歉,无法澄清细节。我正在使用randomForest包来解决回归问题(而不是分类)。这是一个时间序列,每个观察都有其分量。稍后,此权重用于确定测试观察结果之间的模型性能。 y变量是连续的。

最佳答案

randomForest确实具有“ classwt”参数,该参数应允许您考虑差异抽样概率甚至差异成本。诚然,它被回归忽略了。也许您应该解释为什么需要使用加权以及使用哪种类型的y变量。

关于r - 将观察权重合并到randomForest包中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9860252/

10-12 19:35