用Weka的C4.5(J48)决策树处理缺失要素属性值的最佳方法是什么?在训练和分类过程中都会出现缺少值的问题。
使用朴素贝叶斯会更好地处理缺失值吗?我只是给他们分配一个非常小的非零概率,对吧?
最佳答案
华盛顿大学佩德罗·多明戈斯(Pedro Domingos)的ML类(class):
以下是Pedro建议的A
缺失值的三种方法:
A
的其他示异常(exception),分配n
的最常见值A
值p_i
的每个可能值v_i
分配概率A
;将示例的分数p_i
分配给树中的每个后代。 现在可以在here上查看幻灯片和视频。
关于machine-learning - 如何处理C4.5(J48)决策树中缺少的属性值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/13425722/