我正在阅读机器学习中的精度和召回率。
问题 1 :准确率和召回率何时成反比?也就是说,什么时候会出现可以提高准确率但以降低召回率为代价的情况,反之亦然? Wikipedia article 指出:
但是,我已经看到研究实验结果,其中精度和召回率同时增加(例如,当您使用不同或更多特征时)。
逆关系在什么情况下成立?
问题 2 :我熟悉两个领域的精确率和召回率概念:信息检索(例如“从 1MM 页的语料库中返回 100 个最相关的页面”)和二元分类(例如“将这 100 名患者中的每一个分类为有无此病”)。在这两个领域或其中一个领域中,精度和召回率是否成反比?
最佳答案
只有当系统中有一些参数可以改变以获得更多/更少的结果时,逆关系才成立。然后有一个简单的关系:您降低阈值以获得更多结果,其中一些是 TP 和一些 FP。实际上,这并不总是意味着精度或召回率会同时上升和下降 - 可以使用 ROC curve 映射真正的关系。对于 Q2,同样,在这两个任务中,准确率和召回率不一定成反比。
那么,如何提高召回率或准确率,而不是同时影响另一个呢?通常,通过改进算法或模型。 IE。当你只是改变给定模型的参数时,逆关系通常会成立,尽管你应该注意它通常也是非线性的。但是,例如,如果您向模型添加更多描述性特征,则可以同时增加这两个指标。
关于machine-learning - 什么时候准确率和召回率成反比?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25297216/