我正在使用ranger,它是随机森林的快速实现。问题是我不知道如何解释结果的$forest组件。该文件只是说


  forest:已保存的林(如果write.forest设置为TRUE)。请注意,split.varIDs对象中的变量ID不一定
  表示R中的列号。


好吧,这并没有真正的帮助,所以我尝试自己检查一下其组件,因为它们的名称不言自明。

> names(ranger(Species ~ ., data = iris)$forest)
 [1] "dependent.varID"            "num.trees"
 [3] "child.nodeIDs"              "split.varIDs"
 [5] "split.values"               "is.ordered"
 [7] "class.values"               "levels"
 [9] "independent.variable.names" "treetype"


num.trees这样的某些组件很容易理解,但是像child.nodeIDs这样的组件确实令人难以置信。

> ranger(Species ~ ., data = iris)$forest$child.nodeIDs[[1]]
[[1]]
 [1]  1  3  5  0  7  9 11  0  0  0 13 15  0  0  0  0  0

[[2]]
 [1]  2  4  6  0  8 10 12  0  0  0 14 16  0  0  0  0  0


是否记录在某处?

最佳答案

请参见ranger::treeInfo函数的文档:https://www.rdocumentation.org/packages/ranger/versions/0.11.2/topics/treeInfo

08-04 09:24