我有一个使用WEKA
和J48
算法在ID3
中分类的数据集J48
算法的输出是:
Correctly Classified Instances 73 92.4051 %
Incorrectly Classified Instances 6 7.5949 %
Kappa statistic 0.8958
Mean absolute error 0.061
Root mean squared error 0.1746
Relative absolute error 16.7504 %
Root relative squared error 40.9571 %
Total Number of Instances 79
使用id3的输出是:
Correctly Classified Instances 79 100 %
Incorrectly Classified Instances 0 0 %
Kappa statistic 1
Mean absolute error 0
Root mean squared error 0
Relative absolute error 0 %
Root relative squared error 0 %
Total Number of Instances 79
我的问题是,如果
J48
是ID3
的扩展,并且比它更新,那么ID3
为什么会比J48
给出更好的结果? 最佳答案
J48模型是ID3的一个扩展,它考虑了不可用值、连续属性值范围、决策树剪枝、规则推导等问题这种情况下的结果只反映了您使用的数据集的类型。ID3可以在需要更快/更简单结果的情况下实现,而不必考虑J48考虑中的所有附加因素。研究剪枝决策树和导出规则集HERE
在web上有很多关于这些比较结果的主题资源,在我们知道每一个比较结果如何工作的情况下,学习识别在哪种情况下我们应用不同的分类器更为重要(1)
关于algorithm - J48和ID3算法的输出之间的WEKA差异,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29540938/