我正在使用Elasticsearch词组建议程序来纠正用户的拼写错误。除非用户输入第一个字母拼写错误的查询,否则一切都会正常进行。在这种情况下,词组建议程序不返回任何内容或返回意外结果。
我的文档和查询与phrase suggester的示例完全相同:
POST test/test?refresh=true
{"title": "noble warriors"}
POST test/test?refresh=true
{"title": "nobel prize"}
POST test/_search
{
"suggest": {
"text": "noble prize",
"simple_phrase": {
"phrase": {
"field": "title.trigram",
"size": 1,
"gram_size": 3,
"direct_generator": [ {
"field": "title.trigram",
"suggest_mode": "always"
} ],
"highlight": {
"pre_tag": "<em>",
"post_tag": "</em>"
}
}
}
}
}
第一个字母拼写错误的示例:
{
"_shards": ...
"hits": ...
"timed_out": false,
"took": 3,
"suggest": {
"simple_phrase" : [
{
"text" : "mobel prize",
"offset" : 0,
"length" : 11,
"options" : []
}
]
}
}
第四个字母拼写错误的示例:
{
"_shards": ...
"hits": ...
"timed_out": false,
"took": 3,
"suggest": {
"simple_phrase" : [
{
"text" : "noble prize",
"offset" : 0,
"length" : 11,
"options" : [ {
"text" : "nobel prize",
"highlighted": "<em>nobel</em> prize",
"score" : 0.5962314
}]
}
]
}
}
最佳答案
更改生成器的前缀长度。
通常在这样的模糊匹配查询上将前缀长度设置为零的警告往往会对性能产生非常显着的不利影响。
关于elasticsearch - 当第一个字母拼写错误时,elasticsearch短语提示器出现意外结果,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51345802/