嗨,我是Elasticsearch的新手。我无法在 flex 搜索网站中了解hunspell过滤器。我需要使用清晰的示例对hunspell过滤器进行全面说明。
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-hunspell-tokenfilter.html
谢谢
Kumar K.
最佳答案
词干提取是将单词转换为基本形式的过程。
例如:
[ jumping , jumps , jumped ] => jump
[ running , ran ] => run
有两种解决方法
算法方法-使用算法来执行此操作。但是,然后制定一套规则,例如“删除ed”或“删除ing”在所有情况下都无法正常工作。在某些花瓶中,它可能适得其反。但是,这样做可以提高搜索速度。波特梗和雪球就是其中的一些算法
基于字典的-这是hunspell出现的地方。 Hunspell有一个字典,这些字典在这些变体及其基本形式之间建立了映射,并在该字典上进行查找以解析该单词。因此,hunspell对于词干非常准确,但在搜索方面却很慢,因为涉及查找。
关于elasticsearch - 举例说明一下Elasticsearch中的hunspell token 过滤器,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27796568/