我正在尝试使用一些自定义随机森林实现来解决二进制分类问题。

目标是预测项目属于 A 类的可能性。 评估策略被定义为假阳性(A 的可能性高,而实际类别是 B)比假阴性(A 的可能性低,而实际类是 B)受到更严厉的惩罚实际的类是 A)。

应该如何调整标准算法以利用这一点来获得更高的评估分数?

最佳答案

如果您还没有,请尝试使用 rfUtilities 包:https://cran.r-project.org/web/packages/rfUtilities/rfUtilities.pdf

它旨在通过预测单个类别出现的可能性来处理类别不平衡。

关于machine-learning - 随机森林 : how to favor false negatives over false positives,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25295724/

10-12 19:53