我正在尝试使用一些自定义随机森林实现来解决二进制分类问题。
目标是预测项目属于 A 类的可能性。 评估策略被定义为假阳性(A 的可能性高,而实际类别是 B)比假阴性(A 的可能性低,而实际类是 B)受到更严厉的惩罚实际的类是 A)。
应该如何调整标准算法以利用这一点来获得更高的评估分数?
最佳答案
如果您还没有,请尝试使用 rfUtilities 包:https://cran.r-project.org/web/packages/rfUtilities/rfUtilities.pdf
它旨在通过预测单个类别出现的可能性来处理类别不平衡。
关于machine-learning - 随机森林 : how to favor false negatives over false positives,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25295724/