我正在做装袋,并且找出了选择学习集(培训)的代码。
数据集有683个观测值。
# data set named cancer
learningset <- cancer[sample(683,replace=TRUE),]
我需要获得测试集,在我的学习集中从未从原始数据集“癌症”中选择过哪些观察值。
我一直在尝试许多功能,但似乎它们不起作用,因为我仍然可以看到学习集中存在一些观察结果。
最佳答案
或者,您可以像这样使用-
运算符:
ind <- sample( 683 , replace = TRUE )
learningset <- cancer[ ind , ]
testset <- cancer[ - ind , ]