我需要将smote-algorithm应用于数据集,但无法使其正常工作。
例:
x <- c(12,13,14,16,20,25,30,50,75,71)
y <- c(0,0,1,1,1,1,1,1,1,1)
frame <- data.frame(x,y)
library(DMwR)
smotedobs <- SMOTE(y~ ., frame, perc.over=300)
这给出了以下错误:
Error in scale.default(T, T[i, ], ranges) : subscript out of bounds
In addition: Warning messages:
1: In FUN(newX[, i], ...) :
no non-missing arguments to max; returning -Inf
2: In FUN(newX[, i], ...) : no non-missing arguments to min; returning Inf
将寻求任何形式的帮助或提示。
最佳答案
我没有完整的答案。我可以提供另一个线索:
如果将“ y”转换为因子,则SMOTE将返回而不会出现错误-但是综合观测值具有x的NA值。