elasticsearch - 当存在非字母时，Elasticsearch token 生成器转换为小写而不拆分 | 生成器

生成器

java - 如何获取PropertyPlaceHolderConfigurer中所有属性的列表？

c++ - 发出信号后等待pthread_cond_wait等待的线程唤醒需要多少时间？我怎么估计这个时间？

maven - 用不同的Java版本编译Maven模块

javascript - 单击按钮时，如何将每个循环中的文本复制到剪贴板？

ipad - 无法从带有video.js的video.js和带有videojs-youtube的js进行控制以在ipad上工作

android - ProGuard警告不允许我的应用编译发布

php - 通过设置cookie记住密码

oop - Peter Meyer's “programming to an interface”的后续解答

ios - 可以将彩色文本应用于“解析”推送通知吗？

javascript - iOS上的Safari等待10到30秒，然后在页面底部加载JavaScript

javascript - 如何单击以克隆与这些类匹配的所有ID

powershell - 通过Powershell十六进制编辑二进制文件的方法

php - 最好的方式发送外部php变量

powershell - 如何清除整个终端(PowerShell)

android - ACTION_TIME_CHANGED或ACTION_DATE_CHANGED，无法使它们正常工作

elasticsearch - 当存在非字母时，Elasticsearch token 生成器转换为小写而不拆分

扫码查看

当使用Elastic search的lowercase token 生成器时，它会在遇到非字母字符时将文本转换为小写，并将文本分解为术语。

我不希望在遇到非字母时将文本分解为术语。

我研究了standard和letter标记生成器-试图寻找一种构建自定义标记生成器的方法，但徒劳无功。

示例:当使用Postgres9标记生成器将lowercase用作输入时，它会转换为['postgres','9']，但我需要的是['postgres9'](转换为小写而不拆分非字母)

最佳答案

您应该看一下 token 过滤器。
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-tokenfilters.html

这样的事情应该做:

POST _analyze
{
  "tokenizer": "standard",
  "filter":  [ "lowercase"],
  "text":      "ABC4def pqr6LMN Postgres9"
}

07-24 09:39