我需要知道如何为LIBSVM中的以下示例准备数据格式
我有两个体育课和政治课
在体育类中,我有两个文档,其内容如下
Doc1:2014年足球世界杯
Doc2:罗纳尔多是最好的足球运动员
政治类中有三个文件,内容如下
Doc1:政治非常糟糕
Doc2:远离政治
Doc3:政治家是游戏玩家
现在,从以上2类的6个文档中,我想知道如何准备LIBSVM的训练文件?
还有一个问题,我可以为每个类别准备两个LIBSVM培训文件并在LIBSVM.Net中使用。
如果是,那我如何使用两个训练文件并使用它们?
最佳答案
似乎您正在混合两个不同的问题:
如何将文档表示为可以馈入分类器的特征向量
如何使用特定的库,例如LIBSVM或LIMSVM.NET(我不确定第二个是什么,您的意思是this?您应该更具体)。
关于第一个问题,根据任务的不同,存在很多可能性。一种可能的简单方法是tf-idf representation。
关于使用库,您尝试了什么,什么没用?您阅读过文档吗? LIBSVM具有非常丰富的信息和清晰的guide。
关于machine-learning - LIBSVM的数据格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24149048/