我正在使用 Weka 的 J48 (C4.5) 决策树分类器。一般来说,对于决策树,一旦碰到叶子就可以确定分类概率分布吗?我知道朴素贝叶斯,每次分类尝试都会产生一个分类分布。
如果可以使用决策树,那么 Weka J48 树是否可以使用此功能?我也可以尝试实现我自己的树。
最佳答案
由于每个叶子都有一个实际上是离散分布的分类决策,它指示的类别为 100%,所有其他类别为 0。如果需要,您也可以使用训练集为所有内部节点生成分布。
如果您在学习树后进行修剪,您可以通过树重新运行训练集,并用每个实际类在该叶子上的频率标记每个叶子,这将是您的分布。
编辑: 例如,一旦你得到你的树。您可以将一个直方图与每个类的一个 bin 关联到每个节点。然后去对训练集进行分类,如果遍历树中的一个节点,则在该类的对应bin中添加一个。在完成完整的训练集后,只需将每个直方图归一化以加 1。例如,如果您觉得叶子太接近 100%,您可以通过使用每个直方图的熵来确定进一步修剪什么。
关于machine-learning - C4.5 决策树 : classification probability distribution?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11854710/