请参阅附件。我在本地使用mahout。我已经将序列文件转换为稀疏 vector ,并且还将集合分为两组:训练集和测试集:
mahout split -i tweets-vectors/tfidf-vectors --trainingOutput train-vectors --testOutput test-vectors --randomSelectionPct 40 --overwrite --sequenceFiles -xm sequential.
运行此命令时出错
mahout trainnb -i train-vectors -el -li labelindex -o model -ow -c
最佳答案
该java.lang.ArrayIndexOutOfBoundsException
通常是由于您在记录或 vector 中的字段数错误。这可能是由于解析不正确(分隔符错误,逗号分隔文件中的逗号不正确等)或您期望字段位于错误位置的另一个问题引起的。