我已经找到很多答案了,但没有任何用,所以这是我的问题,我有一个索引,其字符串类型为“name”,我用match_phrase做一个简单的全文搜索,但该字段有时是由逗号,点,斜杠或连字符分隔的少数单词的字符串复合,例如“engineer,operator,maintenance”。我需要排除这些结果,例如,如果我有以下名字:
如果我搜索“engineer”,我想获得最后两个结果,而排除第一个。我试过这样的must not子句:
"query": {
"bool": {
"must": {
"match_phrase": {
"name": "Vendedor"
}
},
"must_not":{
"match":{
"name": "\."
}
}
}
}
我也尝试使用正则表达式,但是它总是使我得到错误字符的结果:
"must_not":{
"regexp":{
"name": ".*[\-\.\/\.].*"
}
}
我做错了什么,应该怎么完成这项任务?
最佳答案
在索引设置中,您可以像这样添加一个字符过滤器和模式,但随后需要重新索引,请在此处查看更多详细信息https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-analyzer.html
"char_filter": {
"pattern": {
"pattern": "\\W+",
"type": "pattern_replace",
"replacement": " "
},
"html": {
"type": "html_strip"
}
}