我正在尝试在MNIST数据集上训练svm分类器,以区分两个字符。我正在使用C = 10和gamma = 10 ^ -6的指数内核。我还打印了支持向量:

clfretrainC=svm.SVC(C=Cfinal,kernel="rbf",gamma=gammafinal)
clfretrainC.fit(ReTraintotx,ReTraintoty)
Pefinal=1-clfretrainC.score(Testtotx,Testtoty)
print "Test Error"
print Pefinal

print "Number of Support Vectors"
print clfretrainC.support_vectors_
print clfretrainC.support_vectors_.shape

sv=clfretrainC.support_vectors_


但是,我希望找到最接近分离超平面并因此最难分类的支持向量。是否有允许我执行此操作的功能?

如果没有,我该如何处理?

最佳答案

如果查看sklearn.svm.SVC的文档,您将看到:


  Decision_function(X)样本X到分离超平面的距离。


所以你可以做(​​对于n个最近的向量)

clf.support_vectors_[np.abs(clf.decision_function(clf.support_vectors_)).argsort()[:n]]

关于python - 从数据集中查找最难分类的支持向量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48966446/

10-12 21:39