我需要将smote-algorithm应用于数据集,但无法使其正常工作。

例:

x <- c(12,13,14,16,20,25,30,50,75,71)
y <- c(0,0,1,1,1,1,1,1,1,1)

frame <- data.frame(x,y)

library(DMwR)

smotedobs <- SMOTE(y~ ., frame, perc.over=300)


这给出了以下错误:

Error in scale.default(T, T[i, ], ranges) : subscript out of bounds
In addition: Warning messages:
1: In FUN(newX[, i], ...) :
  no non-missing arguments to max; returning -Inf
2: In FUN(newX[, i], ...) : no non-missing arguments to min; returning Inf


将寻求任何形式的帮助或提示。

最佳答案

我没有完整的答案。我可以提供另一个线索:

如果将“ y”转换为因子,则SMOTE将返回而不会出现错误-但是综合观测值具有x的NA值。

07-24 09:55