在weka中,我分别看到了"is"类和“否”类的F-measure。但是使用加权平均 F-measure 来比较模型的性能有什么好处。请帮我找到答案:)

最佳答案

让我们从一个聪明的例子开始,使用机器学习对文本中的蛋白质相互作用进行分类,我们的分类器试图将句子分为两类:(1)正类(2)负类。正类包含描述蛋白质相互作用的句子,负类包含不描述蛋白质相互作用的句子。作为一名研究人员,我的重点将是我的分类器对正类的 F 分数。为什么?因为我有兴趣看到我的分类器在对包含蛋白质相互作用的句子进行分类方面的表现,而我并不关心它对否定句子进行分类的能力。因此,我将只考虑正类的 F-score。

然而,对于另一个经典问题,如垃圾邮件分类,我们的分类器将电子邮件分为两类:(1) 垃圾邮件和 (2) 垃圾邮件,场景略有不同。作为一名研究人员,我想知道我的分类器对火腿和垃圾邮件进行分类的能力。那时,我可以单独或以汇总的方式检查每个类(class)的 F 分数。火腿和垃圾邮件类别的 F 分数的加权平均值是检查我们的分类器对两个类别(在这种情况下,对于多类别问题阅读全部)类别的性能的一种手段。因为加权 F-measure 只是所有 F-measure 的总和,每个 F-measure 根据具有该特定类标签的实例数和两个类进行加权,计算如下:

Weighted F-Measure=((F-Measure for n class X number of instances from n class)+(F-Measure for y class X number of instances from y class))/total instances in dataset.

因此,底线是 - 如果分类对所有类别都敏感,则使用所有类别的 F 分数的加权平均值。

关于weka - 在weka中使用加权平均F测度有什么好处,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34042850/

10-12 17:49