我正在尝试进行一组评论,并将其转换为ARFF格式以用于WEKA。不幸的是,要么我完全误解了格式的工作方式,要么我不得不为所有可能的单词都设置一个属性,然后是一个状态指示符。有谁知道更好的方法,或者理想情况下有示例ARFF文件?
最佳答案
如果将评论存储在纯文本文件和其他文件夹中(在您的情况下为正数和负数),则可以使用TextDirectoryLoader。
您可以在Weka的KnowledgeFlow应用程序中或从命令行中找到它。此处更多信息:http://weka.wikispaces.com/ARFF+files+from+Text+Collections