R gbm函数中的weights
参数是什么?是否实现成本敏感随机梯度提升?
最佳答案
您可能已经读过此书,但是文档说weights
参数是通过以下方式定义的:
因此,我的解释是,它们是任何统计模型中的标准观察权重。
它对成本敏感吗?好问题。我首先注意到该软件包的主要引文之一是:
B·克里格勒(B.Kriegler)(2007)。 Cost-Sensitive Stochastic Gradient Boosting Within a Quantitative Regression Framework。
因此我认为它确实暗示着成本敏感性,但是在小插图中没有明确使用该术语,所以如果它不明显的话。
不过,我进行了更深入的研究,发现了更多资源。您可以在描述该软件包的this文章末尾找到描述权重的等式。
我也发现这个问题被问到way back in 2009 in a mailing list,尽管没有任何回应,但我终于找到了一个scholarly article,讨论了使用gbm
和其他R包进行成本敏感的梯度提升。
结论是gbm
的分位数损失函数是可微的,可用于对成本敏感的应用中,其中高估/低估具有不同的错误成本,但是在某些应用中可能需要/适合其他定量损失函数(除分位数之外)成本敏感型梯度提升。
该论文以gbm
为中心,还讨论了其他软件包,如果您的重点是成本敏感的梯度提升,那么您可能还希望看看他们在论文中提到的其他软件包。
关于r - R gbm函数中的权重参数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29674116/