如何从朴素贝叶斯模型计算每个班级的准确性,准确性和召回率?
我正在使用嵌入式数据集:针对朴素贝叶斯的虹膜和包装树以及包装e1071。混淆矩阵如下:

prediction   setosa versicolor virginica
setosa         29          0         0
versicolor      0         20         2
virginica       0          3        21


附注:请注意,我正在使用75个条目作为训练集,而其他用于测试:

iris.train <- c(sample(1:150, 75)) # have selected 75 randomly

最佳答案

在整个答案中,mat是您描述的混淆矩阵。

您可以使用以下方法计算和存储准确性:

(accuracy <- sum(diag(mat)) / sum(mat))
# [1] 0.9333333


可以使用以下公式计算每个类别的精度(假设预测在行上,真实结果在列上):

(precision <- diag(mat) / rowSums(mat))
#     setosa versicolor  virginica
#  1.0000000  0.9090909  0.8750000


如果要获取特定类的精度,可以执行以下操作:

(precision.versicolor <- precision["versicolor"])
# versicolor
#  0.9090909


可以使用以下公式计算每个类别的召回率(再次假设预测位于行中,而真实结果位于列中):

recall <- (diag(mat) / colSums(mat))
#     setosa versicolor  virginica
#  1.0000000  0.8695652  0.9130435


如果您想召回特定班级,可以执行以下操作:

(recall.virginica <- recall["virginica"])
# virginica
# 0.9130435


相反,如果您将真实结果作为行,将预测结果作为列,那么您将翻转精度并调用定义。

数据:

(mat = as.matrix(read.table(text="  setosa versicolor virginica
 setosa         29          0         0
 versicolor      0         20         2
 virginica       0          3        21", header=T)))
#            setosa versicolor virginica
# setosa         29          0         0
# versicolor      0         20         2
# virginica       0          3        21

关于r - 多类别模型的准确性,精确度和召回率,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33081702/

10-12 19:52