我需要知道如何为LIBSVM中的以下示例准备数据格式

我有两个体育课和政治课

在体育类中,我有两个文档,其内容如下

Doc1:2014年足球世界杯
Doc2:罗纳尔多是最好的足球运动员

政治类中有三个文件,内容如下

Doc1:政治非常糟糕
Doc2:远离政治
Doc3:政治家是游戏玩家

现在,从以上2类的6个文档中,我想知道如何准备LIBSVM的训练文件?

还有一个问题,我可以为每个类别准备两个LIBSVM培训文件并在LIBSVM.Net中使用。
如果是,那我如何使用两个训练文件并使用它们?

最佳答案

似乎您正在混合两个不同的问题:


如何将文档表示为可以馈入分类器的特征向量
如何使用特定的库,例如LIBSVM或LIMSVM.NET(我不确定第二个是什么,您的意思是this?您应该更具体)。


关于第一个问题,根据任务的不同,存在很多可能性。一种可能的简单方法是tf-idf representation

关于使用库,您尝试了什么,什么没用?您阅读过文档吗? LIBSVM具有非常丰富的信息和清晰的guide

关于machine-learning - LIBSVM的数据格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24149048/

10-12 22:15