原创博文,转载请注明出处!

1.ROC曲线介绍

  • ROC曲线适用场景
    • 二分类任务中,positive和negtive同样重要时,适合用ROC曲线评价

  • ROC曲线的意义
    • TPR的增长是以FPR的增长为代价

2.ROC曲线绘制

  • 纵坐标为TPR
    • TPR(True Positive Rate)真正确率,即模型正确识别正例的比例,TPR=TP/(TP+FN)
  • 横坐标为FPR
    • FPR(False Positive Rate)假正确率,即模型错误将反例识别为正例的比例,FPR=FP/(FP+TN)
  • ROC曲线的绘制过程
    • 给定m个正例和n个反例。首先,根据学习器预测结果对样本排序;然后,先把所有样本均预测为反例,再一次将每个样本划分为正例(阈值从大到小的过程)。

3.sklearn中roc曲线

  1 from sklearn.metrics import roc_curve
2 tpr,fpr,thresholds = roc_curve(y_test,y_pred)
3
4 import matplotlib.pyplot as plt
5 plt.plot(fpr, tpr)
6 plt.xlim([0.0, 1.0])
7 plt.ylim([0.0, 1.0])
8 plt.title('ROC curve for diabetes classifier')
9 plt.xlabel('False Positive Rate (1 - Specificity)')
10 plt.ylabel('True Positive Rate (Sensitivity)')
11 plt.grid(True)
05-11 17:43