原创博文,转载请注明出处!
1.ROC曲线介绍
- ROC曲线适用场景
- 二分类任务中,positive和negtive同样重要时,适合用ROC曲线评价
- ROC曲线的意义
- TPR的增长是以FPR的增长为代价
2.ROC曲线绘制
- 纵坐标为TPR
- TPR(True Positive Rate)真正确率,即模型正确识别正例的比例,TPR=TP/(TP+FN)
- 横坐标为FPR
- FPR(False Positive Rate)假正确率,即模型错误将反例识别为正例的比例,FPR=FP/(FP+TN)
- ROC曲线的绘制过程
- 给定m个正例和n个反例。首先,根据学习器预测结果对样本排序;然后,先把所有样本均预测为反例,再一次将每个样本划分为正例(阈值从大到小的过程)。
3.sklearn中roc曲线
1 from sklearn.metrics import roc_curve
2 tpr,fpr,thresholds = roc_curve(y_test,y_pred)
3
4 import matplotlib.pyplot as plt
5 plt.plot(fpr, tpr)
6 plt.xlim([0.0, 1.0])
7 plt.ylim([0.0, 1.0])
8 plt.title('ROC curve for diabetes classifier')
9 plt.xlabel('False Positive Rate (1 - Specificity)')
10 plt.ylabel('True Positive Rate (Sensitivity)')
11 plt.grid(True)