我试图了解MITIE如何与Rasa集成。我想知道MITIE文件total_word_feature_extractor.dat到底包含什么?我找不到关于此的任何好的文档。

谢谢!

最佳答案

如果您在Github上的MITIE repo中深入了解,您将找到答案。例如,这是有关该文件内容的bit of information


  至于里面的内容,是的,它是word2vec的变体,它基于本文的两步CCA方法:http://icml.cc/2012/papers/763.pdf。我还对其进行了升级,使其包含类似于CCA方法的内容,但可以通过分析词形来生成词向量来处理样本单词。这显着改善了包含大量不在原始词典中的单词的数据集的结果。


至于MITIE如何集成到Rasa中,它是Rasa的few backend choices之一。它提供可以同时进行意图分类和NER的few pipeline components。两者都使用SVM并使用total_word_feature_extractor.dat提供单独的单词向量。

09-07 11:28