R gbm函数中的weights参数是什么?是否实现成本敏感随机梯度提升?

最佳答案

您可能已经读过此书,但是文档说weights参数是通过以下方式定义的:



因此,我的解释是,它们是任何统计模型中的标准观察权重。

它对成本敏感吗?好问题。我首先注意到该软件包的主要引文之一是:

B·克里格勒(B.Kriegler)(2007)。 Cost-Sensitive Stochastic Gradient Boosting Within a Quantitative Regression Framework

因此我认为它确实暗示着成本敏感性,但是在小插图中没有明确使用该术语,所以如果它不明显的话。

不过,我进行了更深入的研究,发现了更多资源。您可以在描述该软件包的this文章末尾找到描述权重的等式。

我也发现这个问题被问到way back in 2009 in a mailing list,尽管没有任何回应,但我终于找到了一个scholarly article,讨论了使用gbm和其他R包进行成本敏感的梯度提升。

结论是gbm的分位数损失函数是可微的,可用于对成本敏感的应用中,其中高估/低估具有不同的错误成​​本,但是在某些应用中可能需要/适合其他定量损失函数(除分位数之外)成本敏感型梯度提升。

该论文以gbm为中心,还讨论了其他软件包,如果您的重点是成本敏感的梯度提升,那么您可能还希望看看他们在论文中提到的其他软件包。

关于r - R gbm函数中的权重参数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29674116/

10-11 10:55