我正在寻找如何在Java中使用lucene用lucene来消除和消除法文编写的文档中的空单词的问题,但是我找不到很好的老师。

最佳答案

这很容易,您所需要的就是这样的FrenchAnalyzer:

IndexWriterConfig conf= new IndexWriterConfig (Version.LUCENE_45,new FrenchAnalyzer(Version.LUCENE_45,FrenchAnalyzer.getDefaultStopSet()));


对于空词,我们使用:FrenchAnalyzer.getDefaultStopSet()就像我在前面的代码中所做的那样,对于词形化,它已经集成在此分析器中,您会注意到当您寻找重要词时(通过tf idf)。

08-05 05:51