引文:常常在看paper的时候。就看到svm算法,可是要自己来写真的是难于上青天呀!

所幸有一个libsvm的集成软件包给我们使用,这真的是太好了。以下简介下怎么来使用它吧!

LIBSVM是一个集成软件包。提供支持向量机分类(C-SVC,nu-SVC),回归(epsilon-SVR,nu-SVR)以及分布预计(one-class SVM).工具包支持多类分类问题。LIBSVM是台湾大学林智仁(LinChih-Jen)副教授等开发设计的一个简单、易于使用和高速有效的SVM模式识别与回归的软件包。

1.libsvm的下载

libsvm下载

libsvm下载地址:http://www.csie.ntu.edu.tw/~cjlin/libsvm/

数据集下载地址 http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/

说明:我自己是在windows下下载的,然后通过ftp软件将libsvm安装包上传到Linux下。

也能够在linux下使用wget来下载。

2.解压缩

解压缩到任一文件夹下,这里我解压到/home/xxxxxx/libsvm-2.91。/home/xxxxxx/是我的用户文件夹。xxxxxx是username。

tar –zxvf libsvm-3.20.tar.gz 

官网上提供了软件包及各种其他工具的下载。

3.编译

拿到软件包的第一件事就是阅读README,面对“读我……读我”这么热情的呼唤你难道无动于衷?

On Unix systems, type make' to build thesvm-train’ and `svm-predict’

programs. Run them without arguments to show the usages of them.

进入到/home/xxxxxx/libsvm-3.20。输入命令

make 

4.执行libsvm

下来解释一下libsvm的程序怎么用.你能够先拿libsvm 附的heart_scale来做输入,底下也以它为例,看到这里你应该也了解使用 SVM 的流程大概就是:

  • 1.准备数据并做成指定格式 (有必要时需 svmscale)
  • 2.用svmtrain来训练成 model
  • 3.对新的输入,使用 svmpredic来预測新数据的类别

4.1 svm-train

svmtrain 的语法大致就是:

svm-train [options] training_set_file [model_file]

training_set_file 就是之前的格式,而 model_file 假设不给就会叫[training_set_file].model.options 能够先不要给。

下列程序执行結果会产生 heart_scale.model 文件:(屏幕输出不是非常重要,沒有错误就好了)

执行代码:

./svm-train heart_scale

输出结果

======================

optimization finished, #iter = 219

nu = 0.431030

obj = -100.877286, rho = 0.424632

nSV = 132, nBSV = 107

Total nSV = 132

======================

5.2 svm-predict

svmpredict 的语法是 :

svm-predict  test_file model_file  output_file
  • (1)test_file就是我们要预測的数据,它的格式svmtrain的输入,也就是training_set_file是一样的,只是每行最前面的label能够省略(由于预測就是要预測那个label)。

    但假设test_file有label的值的话,predict完会顺便拿predict出来的值跟test_file里面写的值去做比对,这代表:test_file写的label是真正的分类结果拿来跟我们预測的结果比对就能够知道预測的效果。所以我们能够拿原training set当做test_file再丟给svm-predict去预測(由于格式一样),看看正确率有多高,方便后面调參数.其他參数就非常好理解了

  • (2)model_file就是svm-train出来的文件;

heart_scale.out:

执行代码

./svm-predict heart_scale heart_scale.model heart_scale.out

得到输出:

=====================================

Accuracy = 86.6667% (234/270) (classification)

Mean squared error = 0.533333 (regression)

Squared correlation coefficient = 0.532639(regression)

=====================================

05-08 15:44