我正在尝试使用fasttext进行文本分类,并且正在Windows上训练850MB的文本语料库,但是仍然出现以下错误:

assertion "counts.size() == osz_" failed: file "src/model.cc", line 206, function: void fasttext::Model::setTargetCounts(const std::vector<long int>&) Aborted (core dumped)


我检查了counts.size()osz_的值,发现counts.size = 2515626osz_ = 300。当我在in.good()的输入流上调用FastText::loadModel时,得到0,in.fail()=1in.eof()=1

我正在使用以下命令来训练和测试我的模型:

./fasttext supervised -input fasttextinput -output fasttextmodel -dim 300 -epoch 5 -minCount 5 -wordNgrams 2

./fasttext test fasttextmodel.bin fasttextinput


我的输入数据根据fasttext github页面的格式正确,所以我想知道这是我的失败还是错误。

感谢您对此的支持!

最佳答案

要关闭该线程:

正如@Sixhobbits指出的那样,该错误与https://github.com/facebookresearch/fastText/issues/73有关(保存fastText监督模型时磁盘空间不足)

关于c++ - 快速文本断言“counts.size()== osz_”失败,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42978836/

10-13 07:39