字段

fields 映射参数允许您通过定义额外的子字段来以多种方式索引同一个字段。通过多字段，主字段值使用其主要映射进行存储。此外，您可以配置一个或多个子字段，使用备用映射，例如，支持不同搜索和聚合需求的不同数据类型或分析器。

当您需要对数据的某种表示执行全文搜索，并对另一种表示执行精确匹配操作（如排序或聚合）时，多字段特别有用。此外，您可以使用不同的分析器索引同一个字段。例如，一个子字段可以使用默认分析器进行通用文本搜索，而另一个子字段可以使用自定义的 n-gram 分析器来支持自动完成或模糊匹配等功能。

配置多字段

在以下示例中，创建了一个名为 articles 的索引，其中包含一个被分析为全文的 title 字段。在 fields 下定义了一个名为 raw 的子字段，用于将相同的值存储为 keyword 以进行精确匹配查询。

PUT /articles
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "fields": {
          "raw": {
            "type": "keyword"
          }
        }
      }
    }
  }
}

使用不同的分析器

在以下示例中，相同的 title 字段使用两种不同的分析器进行索引。主字段使用默认分析器进行全文搜索，而 ngrams 子字段使用自定义的 n-gram 分析器来支持自动完成等功能。

PUT /articles
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ngram_analyzer": {
          "tokenizer": "ngram_tokenizer",
          "filter": [
            "lowercase"
          ]
        }
      },
      "tokenizer": {
        "ngram_tokenizer": {
          "type": "ngram",
          "min_gram": 3,
          "max_gram": 4,
          "token_chars": [
            "letter",
            "digit"
          ]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "fields": {
          "raw": {
            "type": "keyword"
          },
          "ngrams": {
            "type": "text",
            "analyzer": "ngram_analyzer"
          }
        }
      }
    }
  }
}

索引文档

索引创建后，您可以将文档索引到其中。title 字段将按照其映射定义进行处理，其子字段将提供相同值的替代表示。

PUT /articles/_doc/1
{
  "title": "Understanding Multi-Fields in Search"
}

查询多字段

您可以在查询中指定额外的子字段，以适应不同的需求。例如，要对标题的精确值执行聚合，请使用以下请求查询 title.raw 子字段。

POST /articles/_search
{
  "size": 0,
  "aggs": {
    "titles": {
      "terms": {
        "field": "title.raw"
      }
    }
  }
}

title.raw 子字段被映射为 keyword，即使原始标题字段经过全文分析，它也允许进行精确匹配聚合。

{
  ...
  "hits": {
    "total": {
      "value": 1,
      "relation": "eq"
    },
    "max_score": null,
    "hits": []
  },
  "aggregations": {
    "titles": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "Understanding Multi-Fields in Search",
          "doc_count": 1
        }
      ]
    }
  }
}

另外，要使用自动完成功能，您可以在 title.ngrams 子字段上运行 match 查询。

POST /articles/_search
{
  "query": {
    "match": {
      "title.ngrams": "Und"
    }
  }
}

title.ngrams 子字段使用自定义的 n-gram 分析器，因此前缀“Und”成功匹配了单词“Understanding”的开头。

{
  ...
  "hits": {
    "total": {
      "value": 1,
      "relation": "eq"
    },
    "max_score": 0.2876821,
    "hits": [
      {
        "_index": "articles",
        "_id": "1",
        "_score": 0.2876821,
        "_source": {
          "title": "Understanding Multi-Fields in Search"
        }
      }
    ]
  }
}

配置多字段
使用不同的分析器
索引文档
查询多字段

此页面有帮助吗？

✔ 是 ✖ 否

告诉我们原因

剩余 350 字符

有问题？在 OpenSearch 论坛上提问。

想要贡献？编辑此页面或创建问题。

字段

配置多字段

使用不同的分析器

索引文档

查询多字段

OpenSearch 链接

参与其中

资源

联系我们