我正在做装袋,并且找出了选择学习集(培训)的代码。

数据集有683个观测值。

# data set named cancer
learningset <- cancer[sample(683,replace=TRUE),]

我需要获得测试集,在我的学习集中从未从原始数据集“癌症”中选择过哪些观察值。

我一直在尝试许多功能,但似乎它们不起作用,因为我仍然可以看到学习集中存在一些观察结果。

最佳答案

或者,您可以像这样使用-运算符:

ind <- sample( 683 , replace = TRUE )
learningset <- cancer[ ind , ]
testset <- cancer[ - ind , ]

08-24 13:19