秦曾昌人工智能课程---7、决策树集成学习Tree Ensembles
一、总结
一句话总结:
其实机器模型减少variance的比较好的方式就是 多个模型取平均值
1、CART是什么?
classification and regression tree
2、决策树模型的本质是什么?
divide the input space into a few regions
3、我们如何用决策树去做预测?
信息不同属性按重要性依次下分:先划分x1的范围,这就形成了一个二叉树分支,再划分x2的范围,就形成的决策树。
叶子节点是分类,也是预测:预测的话就是不同范围的(x1,x2)就对应了不同的y,这个y就是可以用作预测的
叶子节点是预测值:决策树,非叶子节点就是x1,x2的范围,叶子节点就是预测的值y
4、CART tree 分割的一个例子?
|||-begin
x 1 | 2 3 4 | 5 6 7 8 9 10
y 0 | 1 2 3 | 4 5 6 7 8 9
|||-end