如何搜索词干匹配?

IE。目前,我有许多文档在 item_title 字段中包含“滑板”一词,但只有 3 个文档包含“滑板”一词。因此,当我进行以下搜索时:

POST /my_index/my_type/_search
{
    "size": 100,
    "query" : {
        "multi_match": {
           "query": "skateboards",
           "fields": [ "item_title^3" ]
        }
    }
}

我只得到 3 个结果。但是,我还希望退回带有“滑板”字样的文件。

根据我从 Elasticsearch 的理解,我希望这是通过在 item_title 字段上指定一个映射来完成的,该字段包含一个分析器,该分析器对每个单词的词干版本进行索引,但我似乎无法找到有关如何执行此操作的文档,这表明它以不同的方式完成。

建议?

最佳答案

下面是一个例子:

PUT /stem
{
  "settings": {
    "analysis": {
      "filter": {
        "filter_stemmer": {
          "type": "stemmer",
          "language": "english"
        }
      },
      "analyzer": {
        "tags_analyzer": {
          "type": "custom",
          "filter": [
            "standard",
            "lowercase",
            "filter_stemmer"
          ],
          "tokenizer": "standard"
        }
      }
    }
  },
  "mappings": {
    "test": {
      "properties": {
        "item_title": {
          "analyzer": "tags_analyzer",
          "type": "text"
        }
      }
    }
  }
}

索引一些示例文档:
POST /stem/test/1
{
  "item_title": "skateboards"
}
POST /stem/test/2
{
  "item_title": "skateboard"
}
POST /stem/test/3
{
  "item_title": "skate"
}

执行查询:
GET /stem/test/_search
{
  "query": {
    "multi_match": {
      "query": "skateboards",
      "fields": [
        "item_title^3"
      ]
    }
  },
  "fielddata_fields": [
    "item_title"
  ]
}

并查看结果:
  "hits": [
     {
        "_index": "stem",
        "_type": "test",
        "_id": "1",
        "_score": 1,
        "_source": {
           "item_title": "skateboards"
        },
        "fields": {
           "item_title": [
              "skateboard"
           ]
        }
     },
     {
        "_index": "stem",
        "_type": "test",
        "_id": "2",
        "_score": 1,
        "_source": {
           "item_title": "skateboard"
        },
        "fields": {
           "item_title": [
              "skateboard"
           ]
        }
     }
  ]

我还添加了 fielddata_fields 元素,以便您可以查看该字段的内容是如何编入索引的。如您所见,在这两种情况下,索引项都是 skateboard

关于search - Elasticsearch 与词干匹配,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32229255/

10-13 01:54