在scikit learn的RandomForestClassifier中,没有设置指定每个树应该从多少个样本构建。也就是说,从数据中随机抽取的子集应该有多大才能构建每棵树。
我在查找scikit learn默认提取的样本数时遇到问题。有人知道吗?
最佳答案
我相信RandomForestClassier将使用整个训练集来构建每棵树。通常,构建每棵树需要选择最具预测能力的特性(创建最大“分割”的特性),而拥有更多的数据会使计算更加精确。
关于python - Scikit学习随机森林-每棵树包含多少个样本?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22418958/