我正在尝试为Weka上的数据集获得最佳分类器,并且正在研究随机树算法的不同类型的最大深度。但是我不明白我得到的结果:使用maximum-Depth between 3 and 10的准确率要比使用maximum-Depth>10的要好得多。任何人都可以帮助我找出原因吗?更深的树不应该提供更好的准确性吗?

最佳答案

较深的树提供了更好的训练集准确性,而不是测试集。深树使您的模型更好地适合数据,创建更紧密拟合的决策边界,该边界通常不与类之间的实际边界相对应。

10-05 18:23