同义词格式

同义词最简单的表达形式是 (((“synonyms”, “formatting”))) 逗号分隔:

  1. "jump,leap,hop"

如果遇到这些词项中的任何一项,则将其替换为所有列出的同义词。例如:

  1. 原始词项: 取代:
  2. ────────────────────────────────
  3. jump (jump,leap,hop)
  4. leap (jump,leap,hop)
  5. hop (jump,leap,hop)

或者, 使用 => 语法,可以指定一个词项列表(在左边),和一个或多个替换(右边)的列表:

  1. "u s a,united states,united states of america => usa"
  2. "g b,gb,great britain => britain,england,scotland,wales"
  1. 原始词项: 取代:
  2. ────────────────────────────────
  3. u s a (usa)
  4. united states (usa)
  5. great britain (britain,england,scotland,wales)

如果多个规则指定同一个同义词,它们将被合并在一起,且顺序无关,否则使用最长匹配。以下面的规则为例:

  1. "united states => usa",
  2. "united states of america => usa"

如果这些规则相互冲突,Elasticsearch 会将 United States of America 转换为词项 (usa),(of),(america) 。否则,会使用最长的序列,即最终得到词项 (usa)