我必须创建一个带有RBF核和硬边距的支持向量机分类器。如果我的数值正确的话,这种裕度是由C参数控制的。也就是说,C参数越大,得到的硬边值就越多。有没有一个典型的C值可以模拟一个非常强大的“硬边际”?或者有没有其他的方法来模仿一个强大的硬利润?当然,我们总是可以讨论为什么我们需要效仿硬利润率。但在这种情况下,我需要效仿它!
clf = svm.SVC(C = ??,kernel="rbf",gamma =1.5,shrinking=False,cache_size=3000)
最佳答案
通常你不需要那么大的值,但总的来说这是个主意。试着将其设置为1e10,然后查看结果字母。
如果所有字母都不在C值,则不应用正则化(即,在trainingset=硬边距中所有点都被正确分类)。
顺便说一句,如果你的数据集非常嘈杂,并且不能与你正在使用的内核分离,你就不能达到硬边界。