我正在尝试使用libsvm对数据进行分类,如下图所示:


您可以看到“肉眼可见”的蓝色和红色之间存在柔和的分隔,但是在整个区域中存在一些蓝色样本,我会说“应该标记为红色”。

我无法让libsvm返回有意义的分类,并且使琐碎的所有点标记为蓝色。不同的内核和参数值会发生这种情况。我认为处理成本变量并不能解决这个问题,因为蓝色样本比红色样本多10倍。

我想念什么吗?是否有一些libsvm参数可以处理这种情况?
还是SVM不适合执行该任务,您可以提出建议吗?

最佳答案

使用线性SVM可以获得非平凡的解决方案。
您应该尝试使用不同的C值,并且,由于数据不平衡,请使用wi参数固定每个类的权重。

关于machine-learning - libsvm返回一个简单的解决方案,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11084247/

10-12 21:25