我确实使用包klaR将朴素贝叶斯应用于玩具数据集,并且一切正常。

接下来,我想使用caretmethod="nb"复制相同的分析,这实际上只是NaiveBayes包中klaR函数的包装。

但是,后一种估计不起作用。我确实收到错误消息。

Error in NaiveBayes.default(x, y, usekernel = FALSE, fL = param$fL, ...) :
  Zero variances for at least one class in variables: x1_disc_46, x1_disc_810, x2_disc_46
Timing stopped at: 0.01 0 0.02


我知道玩具数据集的局限性。但是,随着使用klaR软件包进行的分析确实进行了,我想知道如何使用caret复制完全相同的分析吗?

这是代码:

# Data
d <- structure(list(Y = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L,
2L, 1L), .Label = c("0", "1"), class = "factor"), x1_disc = structure(c(1L,
2L, 1L, 2L, 3L, 4L, 4L, 5L, 2L, 4L), .Label = c("_02", "_24",
"_46", "_68", "_810"), class = "factor"), x2_disc = structure(c(1L,
1L, 1L, 1L, 2L, 3L, 3L, 3L, 1L, 2L), .Label = c("_02", "_24",
"_46"), class = "factor")), .Names = c("Y", "x1_disc", "x2_disc"
), row.names = c(NA, -10L), class = "data.frame")



# Works(klaR)
library(klaR)
fit2 <- NaiveBayes(Y ~ x1_disc + x2_disc, usekernel = FALSE, fL = 0, data=d)
predict(fit2, d, threshold = 0)


# Does not work (caret)
library(caret)
model2 <- train(form=Y ~ x1_disc + x2_disc,
                data=d,
                method="nb",
                # Uses package klaR
                # (see: http://topepo.github.io/caret/train-models-by-tag.html)
                trControl=trainControl(method="none"),
                tuneGrid = data.frame(fL=0, usekernel=F, adjust=1))

predict(model2, d, type="prob")

最佳答案

因为它部分解决了您的问题,所以我将我的评论作为答案。我遇到了这个交叉验证的answer,它建议在没有S3公式接口的情况下运行插入符号模型,具体情况如下:

model2 <- train(y=d$Y, x=d[, 2:3], ...)


我不知道为什么会成功,确切的原因,这可能与简历问题不同,因为他们没有错误。

08-25 05:36