我想使用Lucene API从句子中提取ngram。但是,我似乎遇到了一个特殊的问题。在JavaDoc中,有一个名为NGramTokenizer的类。我已经下载了3.6.1和4.0 API,但没有看到此类的任何痕迹。例如,当我尝试以下操作时,出现错误,指出找不到符号NGramTokenizer:

NGramTokenizer myTokenizer;


在文档中,似乎NGramTokenizer在路径org.apache.lucene.analysis.NGramTokenizer中。我在计算机上的任何地方都看不到它。似乎不太可能发生下载或其他错误,因为在3.6.1和4.0 API中


如何获取NGramTokenizer类?
我在项目中添加了lucene-core-3.6.1.jar

最佳答案

您使用了错误的jar。在里面

lucene-analyzers-3.6.1.jar

org.apache.lucene.analysis.ngram.NGramTokenizer

08-05 14:00