我已经将大型pdf文件编入了 flex 搜索引擎。我已经用雪球分析仪分析了这种非结构化数据。这会使用雪球过滤器将“正在运行”等字词转换为“正在运行”。但是,如果我想精确搜索单词“running”怎么办?这对我没有帮助。
我不能使用其他字段,因为这些文件较大,并且可以在更大程度上增加索引的大小。
因此,如何使用雪球过滤器来使用“preserver_original”之类的内容。这样我就可以保留原词和词干。
根据我的要求,有没有其他方法可以分析该 Realm ?
最佳答案
您可以使用“原位填充”:
https://www.elastic.co/guide/en/elasticsearch/guide/current/stemming-in-situ.html