我正在使用Elasticsearch 5.5.2
我正在尝试词组建议程序,但无法对其进行配置以返回已经在索引中的确切建议。我的索引设置,类型映射和短语建议查询如下。请帮忙。
我的索引设置和类型映射是
PUT test
{
"settings": {
"index": {
"analysis": {
"analyzer": {
"trigram_analyzer": {
"type": "custom",
"tokenizer": "standard",
"filter": ["shingle"]
}
},
"filter": {
"shingle": {
"type": "shingle",
"min_shingle_size": 2,
"max_shingle_size": 3
}
}
}
}
},
"mappings": {
"test": {
"properties": {
"title": {
"type": "text",
"fields": {
"trigram": {
"type": "text",
"analyzer": "trigram_analyzer"
}
}
}
}
}
}
}
索引文件使用
POST test/test?refresh=true
{"title": "noble prize"}
我正在使用的短语建议者
POST test/_search
{
"suggest": {
"text": "nobe priz",
"simple_phrase": {
"phrase": {
"field": "title.trigram",
"size": 1,
"gram_size": 3,
"direct_generator": [ {
"field": "title.trigram",
"suggest_mode": "always"
} ],
"highlight": {
"pre_tag": "<em>",
"post_tag": "</em>"
}
}
}
}
}
我得到的结果是
"suggest": {
"simple_phrase": [
{
"text": "nobe priz",
"offset": 0,
"length": 9,
"options": [
{
"text": "noble priz",
"highlighted": "<em>noble</em> priz",
"score": 0.09049256
}
]
}
]
}
我的问题是,对于搜索文字-“nobe priz”-为什么我没有获得“贵族奖”作为建议。取而代之的是为什么我只得到“高贵的priz”?
如果看到的话,“高贵奖品”就是我保存的文件。
而且,如果我将size的值增加到“2”,那么我也不会获得“贵族奖”作为建议之一。
大小为2,对于搜索文本“nobe priz”,我得到以下响应
"suggest": {
"simple_phrase": [
{
"text": "nobe priz",
"offset": 0,
"length": 9,
"options": [
{
"text": "noble priz",
"highlighted": "<em>nobel</em> priz",
"score": 0.09049256
},
{
"text": "nobe prize",
"highlighted": "nobe <em>prize</em>",
"score": 0.09049256
}
]
}
]
}
我应该怎么做才能获得“贵族奖”作为建议?
请帮忙。
最佳答案
我自己找到了答案。需要使用参数“max_errors”告诉ES,搜索文本中有多少个单词拼写错误。 “max_errors”可以百分比形式给出,以float或绝对数字的形式给出。
“单击以下链接以获取具有max_errors参数的词组建议程序的ES文档”
https://www.elastic.co/guide/en/elasticsearch/reference/master/search-suggesters-phrase.html
因此,我将“max_errors”参数值添加为2,如下所示
POST test/_search
{
"suggest": {
"text": "nobe priz",
"simple_phrase": {
"phrase": {
"field": "title.trigram",
"size": 1,
"gram_size": 3,
"max_errors": 2,
"direct_generator": [ {
"field": "title.trigram",
"suggest_mode": "always"
} ],
"highlight": {
"pre_tag": "<em>",
"post_tag": "</em>"
}
}
}
}
}
而且我得到了完全匹配的短语建议如下
"suggest": {
"simple_phrase": [
{
"text": "nobe priz",
"offset": 0,
"length": 9,
"options": [
{
"text": "noble prize",
"highlighted": "<em>noble prize</em>",
"score": 0.4833575
}
]
}
]
}
因此,将max_errors设置为2时,建议“贵重物品”将返回。
干杯:)
关于elasticsearch - Elasticsearch,如何使词组提示返回准确建议?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46997796/