我已经找到很多答案了,但没有任何用,所以这是我的问题,我有一个索引,其字符串类型为“name”,我用match_phrase做一个简单的全文搜索,但该字段有时是由逗号,点,斜杠或连字符分隔的少数单词的字符串复合,例如“engineer,operator,maintenance”。我需要排除这些结果,例如,如果我有以下名字:

  • “工程师,操作员,维护人员”
  • “工程师”
  • “工业工程师

  • 如果我搜索“engineer”,我想获得最后两个结果,而排除第一个。我试过这样的must not子句:
    "query": {
      "bool": {
        "must": {
          "match_phrase": {
            "name": "Vendedor"
          }
        },
        "must_not":{
          "match":{
            "name": "\."
          }
        }
      }
    }
    

    我也尝试使用正则表达式,但是它总是使我得到错误字符的结果:
    "must_not":{
          "regexp":{
            "name": ".*[\-\.\/\.].*"
          }
        }
    

    我做错了什么,应该怎么完成这项任务?

    最佳答案

    在索引设置中,您可以像这样添加一个字符过滤器和模式,但随后需要重新索引,请在此处查看更多详细信息https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-analyzer.html

                  "char_filter": {
                      "pattern": {
                         "pattern": "\\W+",
                         "type": "pattern_replace",
                         "replacement": " "
                      },
                      "html": {
                         "type": "html_strip"
                      }
                   }
    

    10-07 13:15
    查看更多