我有一个使用WEKAJ48算法在ID3中分类的数据集J48算法的输出是:

Correctly Classified Instances          73               92.4051 %

Incorrectly Classified Instances         6                7.5949 %

Kappa statistic                          0.8958

Mean absolute error                      0.061

Root mean squared error                  0.1746

Relative absolute error                 16.7504 %

Root relative squared error             40.9571 %

Total Number of Instances               79

使用id3的输出是:
Correctly Classified Instances          79              100      %

Incorrectly Classified Instances         0                0      %

Kappa statistic                          1

Mean absolute error                      0

Root mean squared error                  0

Relative absolute error                  0      %

Root relative squared error              0      %

Total Number of Instances               79

我的问题是,如果J48ID3的扩展,并且比它更新,那么ID3为什么会比J48给出更好的结果?

最佳答案

J48模型是ID3的一个扩展,它考虑了不可用值、连续属性值范围、决策树剪枝、规则推导等问题这种情况下的结果只反映了您使用的数据集的类型。ID3可以在需要更快/更简单结果的情况下实现,而不必考虑J48考虑中的所有附加因素。研究剪枝决策树和导出规则集HERE
在web上有很多关于这些比较结果的主题资源,在我们知道每一个比较结果如何工作的情况下,学习识别在哪种情况下我们应用不同的分类器更为重要(1)

关于algorithm - J48和ID3算法的输出之间的WEKA差异,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29540938/

10-10 07:12