我很难在python中绘制OneClassSVM的AUC图(我正在使用sklearn生成像[[tp, fp],[fn,tn]]
和fn=tn=0
这样的混淆矩阵。
from sklearn.metrics import roc_curve, auc
fpr, tpr, thresholds = roc_curve(y_test, y_nb_predicted)
roc_auc = auc(fpr, tpr) # this generates ValueError[1]
print "Area under the ROC curve : %f" % roc_auc
plt.plot(fpr, tpr, label='ROC curve (area = %0.2f)' % roc_auc)
我想处理错误[1],并为
AUC
绘制OneClassSVM
。[1] ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
最佳答案
有关类似问题,请参见my answer。要点是:
OneClassSVM从根本上不支持将决策转换为概率分数,因此您无法将必要的分数传递到需要改变分数阈值的函数中,例如ROC或Precision-Recall曲线和分数。
您可以通过在输入数据中计算OneClassSVM决策函数的最大值来近似这种分数,将其称为MAX
,然后通过计算y
对给定观察值y_score = MAX - decision_function(y)
的预测进行评分。
使用这些分数以y_score
的形式传递给诸如average_precision_score
等的函数,这些函数将接受非阈值分数而不是概率。
最后,请记住,ROC对OneClassSVM的物理意义不大,特别是因为OneClassSVM用于存在预期的巨大类别失衡(异常值与非异常值)且ROC无法准确地权衡相对成功的情况在少量异常值上。