1、首先下载安装weka
http://www.cs.waikato.ac.nz/ml/weka/downloading.html
2、打开weka,选择第一项Explorer
3、准备数据集文件,在weka中,一般数据文件为:xxx.arff,比如我编辑一个文件叫做tumor.arff,文件的内容为:
@RELATION tumor
@ATTRIBUTE size NUMERIC
@ATTRIBUTE 'Class' {'1','0'}
@DATA
0.0,'0'
0.1,'0'
0.7,'1'
1.0,'0'
1.1,'0'
1.3,'0'
1.4,'1'
1.7,'1'
2.1,'1'
2.2,'1'
稍微解释一下数据,size属性表示tumor的大小,被单引号括起来的Class应该是weka中的保留字,专门表示类别。
4、加载数据。在主界面的Preprocess选项卡下,点Open file,然后选择第三步中准备好的数据文件:tumor.arff
在这个界面下,可以看到关于数据的一些统计信息,以及一些图形化的显示,同学们可以自己探索。
6、切换到主界面的Classify选项卡,点击Choose,在functions分支下面选择Logistic。
Test options选择Use training set,然后点击Start即可
7、再给出一组测试数据:
@RELATION tumor
@ATTRIBUTE x1 NUMERIC
@ATTRIBUTE x2 NUMERIC
@ATTRIBUTE 'Class' {'1','0'}
@DATA
0.0 2.9 '0'
1 1.9 '0'
2.0 0.9 '0'
3.0 -0.1 '0'
4.0 -1.1 '0'
0.0 2.5 '0'
1 1.5 '0'
2.0 0.5 '0'
3.0 -0.5 '0'
4.0 -1.5 '0'
0.0 2.0 '0'
1 1 '0'
2.0 0.0 '0'
3.0 -1 '0'
4.0 -2.0 '0'
0.0 1 '0'
1 0.0 '0'
2.0 -1 '0'
3.0 -2.0 '0'
4.0 -3.0 '0'
0.2 2.9 '1'
1.2 1.9 '1'
2.2 0.9 '1'
3.2 -0.1 '1'
4.2 -1.1 '1'
1.2 2.9 '1'
2.2 1.9 '1'
3.2 0.9 '1'
4.2 -0.1 '1'
5.2 -1.1 '1'
2.2 2.9 '1'
3.2 1.9 '1'
4.2 0.9 '1'
5.2 -0.1 '1'
6.2 -1.1 '1'
3.0 0.2 '0'
1 2.3 '0'
1 1.8 '1'
2.0 0.8 '1'
weka训练结果:
训练出来的模型是:h(x)=1/(1+exp(-(-13.9827+4.6001*x1+4.6302*x2)))