我正在寻找如何在Java中使用lucene用lucene来消除和消除法文编写的文档中的空单词的问题,但是我找不到很好的老师。
最佳答案
这很容易,您所需要的就是这样的FrenchAnalyzer:
IndexWriterConfig conf= new IndexWriterConfig (Version.LUCENE_45,new FrenchAnalyzer(Version.LUCENE_45,FrenchAnalyzer.getDefaultStopSet()));
对于空词,我们使用:FrenchAnalyzer.getDefaultStopSet()就像我在前面的代码中所做的那样,对于词形化,它已经集成在此分析器中,您会注意到当您寻找重要词时(通过tf idf)。