使用下面的精度召回图,其中召回在x轴上,精度在y轴上,我可以使用此公式来计算给定精度,召回阈值的预测数量吗?
这些计算基于橙色趋势线。
假设此模型已在100个实例上进行了训练,并且是二进制分类器。
召回值为0.2时(0.2 * 100)= 20个相关实例。在召回值为0.2时,精度= .95,所以真实阳性的数量(20 * .95)=19。这是从精确召回图中计算真实阳性的数量的正确方法吗?
最佳答案
我会辩解说不可能这样做。为了简化计算,我将召回20%,90%的精度和100个观察值。
我可以制作两个将产生这些数字的结果矩阵。 TP/TN表示测试阳性和阴性,CP/CN表示条件阳性/阴性:
CP CN
TP 9 1
TN 36 54
和
CP CN
TP 18 2
TN 72 8
矩阵1的TP为9,FP为1,FN为36,因此召回率为9/(36 + 9)= 20%,精度为9/(1 + 9)= 90%
矩阵2的TP为18,FP为2,FN为72,召回率为18/(72 + 18)= 20%,精度为18/(2 + 18)= 90%
由于我可以产生两个具有不同TP且具有相同的查全率+精度的矩阵,因此该图无法提供足够的信息来追溯TP。
关于machine-learning - 从精确召回曲线计算真实正数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55147261/