我正在尝试在大约1000个对象的集合中运行分类器,每个对象具有6个浮点变量。我已经使用scikit-learn的交叉验证功能来生成几种不同模型的预测值数组。然后,我使用sklearn.metrics来计算分类器和混淆表的准确性。大多数分类器的准确度约为20-30%。下面是SVC分类器的混淆表(准确度为25.4%)。

python - 有什么好的指标可以评估多分类器的性能?-LMLPHP

由于我是机器学习的新手,因此不确定如何解释该结果以及不确定是否有其他好的指标来评估问题。从直觉上讲,即使以25%的准确度,并且鉴于分类器正确地获得了25%的预测,我相信它至少在某种程度上有效,对吗?我该如何用统计参数来表达?

最佳答案

如果此表是一个混淆表,则我认为您的分类器大部分时间都在预测类E。实例
举例来说,如果您有3个类别,即A,B,C,并且在测试数据集中,如果分类器预测所有时间类别为A,则类别A的代表度过高(90%),那么您将具有90%的准确性,

一个好的指标是使用对数损失,逻辑回归是一个优化此指标的好的算法
https://stats.stackexchange.com/questions/113301/multi-class-logarithmic-loss-function-per-class

另一种解决方案是对小类进行过度采样

关于python - 有什么好的指标可以评估多分类器的性能?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40972485/

10-13 01:22