ML3.1 介绍e1071包实施朴素贝叶斯分类的函数,本例使用klaR包中的NaiveBayes函数,因为该函数较之前者增加了两个功能,一个是可以输入先验概率,另一个是在正态分布基础上增加了核平滑密度函数。为了避免过度拟合,在训练时还要将数据分割进行多重检验,所以我们还使用了caret包的一些函数进行配合。
caret::train
语法: train(form, data, ..., weights, subset, na.action = na.fail, contrasts = NULL)
- 安装程序包
install.packages("caret")
install.packages("mlbench")
install.package("klaR") - 创建训练集和测试集
library(lattice)
library(ggplot2)
library(caret)
library(mlbench)
library(MASS)
library(klaR) # 使用朴素贝叶斯建模,这里使用了三次10折交叉检验得到30个结果
fitControl <- trainControl(method = "repeatedcv", number = 10, repeats = 3,returnResamp = "all")
model1 <- train(Species~., data = iris.train,method='nb',trControl = fitControl) - 加载包 使用朴素贝叶斯建模
fitControl <- trainControl(method = "repeatedcv", number = 10, repeats = 3,returnResamp = "all")
model1 <- train(Species~., data = iris.train,method='nb',trControl = fitControl) - 返回测试数据的混淆矩阵
> pred3 <- predict(model1, iris.test, type="raw")
> table(pred3,iris.test$Species) pred3 setosa versicolor virginica
setosa 10 0 0
versicolor 0 18 2
virginica 0 0 20