链接:https://www.zhihu.com/question/39840928/answer/146205830
来源:知乎

一、混淆矩阵

混淆矩阵如图1分别用”0“和”1“代表负样本和正样本。FP代表实际类标签为”0“,但预测类标签为”1“的样本数量。其余,类似推理。

ROC曲线和AUC值-LMLPHPROC曲线和AUC值-LMLPHP

二、假正率和真正率

假正率(False Positive Rate,FPR)是实际标签为”0“的样本中,被预测错误的比例。真正率(True Positive Rate,TPR)是实际标签为”1“的样本中,被预测正确的比例。其公式如下:

ROC曲线和AUC值-LMLPHPROC曲线和AUC值-LMLPHP

三、ROC曲线是一系列threshold下的(FPR,TPR)数值点的连线。此时的threshold的取值分别为测试数据集中各样本的预测概率。
ROC曲线和AUC值-LMLPHP

AUC(Area Under roc Cure),顾名思义,其就是ROC曲线小的面积,在此例子中AUC=0.62。AUC越大,说明分类效果越好。

 
 
 
05-11 20:57