Link Search Menu Expand Document Documentation Menu

桶排序聚合

bucket_sort 聚合是一个父聚合,用于对其父多桶聚合生成的桶进行排序或截断。

bucket_sort 聚合中,您可以根据多个字段对桶进行排序,每个字段都有自己的排序顺序。桶可以按其键、文档计数或子聚合的值进行排序。您还可以使用 fromsize 参数来截断结果,无论是否排序。

有关指定排序顺序的信息,请参阅排序结果

参数

bucket_sort 聚合接受以下参数。

参数 必需/可选 数据类型 描述
gap_policy 可选 字符串 应用于缺失数据的策略。有效值为 skipinsert_zeros。默认为 skip。请参阅数据间隙
sort(排序) 可选 字符串 要排序的字段列表。请参阅排序结果
from 可选 字符串 要返回的第一个结果的索引。必须是非负整数。默认为 0。请参阅fromsize 参数
size 可选 字符串 要返回的最大结果数。必须是正整数。请参阅fromsize 参数

您必须至少提供 sortfromsize 中的一个。

示例

以下示例根据 OpenSearch Dashboards 电子商务示例数据创建一个以一个月为间隔的日期直方图。sum 子聚合计算每个月的总字节数。最后,聚合按字节数降序排序桶。

GET opensearch_dashboards_sample_data_logs/_search
{
  "size": 0,
  "aggs": {
    "sales_per_month": {
      "date_histogram": {
        "field": "@timestamp",
        "calendar_interval": "month"
      },
      "aggs": {
        "total_bytes": {
          "sum": {
            "field": "bytes"
          }
        },
        "bytes_bucket_sort": {
          "bucket_sort": {
            "sort": [
              { "total_bytes": { "order": "desc" } }
            ]
          }
        }
      }
    }
  }
}

示例响应

聚合按总字节数降序重新排序桶。

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 10000,
      "relation": "gte"
    },
    "max_score": null,
    "hits": []
  },
  "aggregations": {
    "sales_per_month": {
      "buckets": [
        {
          "key_as_string": "2025-05-01T00:00:00.000Z",
          "key": 1746057600000,
          "doc_count": 7072,
          "total_bytes": {
            "value": 40124337
          }
        },
        {
          "key_as_string": "2025-06-01T00:00:00.000Z",
          "key": 1748736000000,
          "doc_count": 6056,
          "total_bytes": {
            "value": 34123131
          }
        },
        {
          "key_as_string": "2025-04-01T00:00:00.000Z",
          "key": 1743465600000,
          "doc_count": 946,
          "total_bytes": {
            "value": 5478221
          }
        }
      ]
    }
  }
}

示例:截断结果

要截断结果,请提供 from 和/或 size 参数。以下示例执行相同的排序,但返回两个桶,从第二个桶开始。

GET opensearch_dashboards_sample_data_logs/_search
{
  "size": 0,
  "aggs": {
    "sales_per_month": {
      "date_histogram": {
        "field": "@timestamp",
        "calendar_interval": "month"
      },
      "aggs": {
        "total_bytes": {
          "sum": {
            "field": "bytes"
          }
        },
        "bytes_bucket_sort": {
          "bucket_sort": {
            "sort": [
              { "total_bytes": { "order": "desc" } }
            ],
            "from": 1,
            "size": 2
          }
        }
      }
    }
  }
}

聚合返回两个已排序的桶。

{
  "took": 2,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 10000,
      "relation": "gte"
    },
    "max_score": null,
    "hits": []
  },
  "aggregations": {
    "sales_per_month": {
      "buckets": [
        {
          "key_as_string": "2025-06-01T00:00:00.000Z",
          "key": 1748736000000,
          "doc_count": 6056,
          "total_bytes": {
            "value": 34123131
          }
        },
        {
          "key_as_string": "2025-04-01T00:00:00.000Z",
          "key": 1743465600000,
          "doc_count": 946,
          "total_bytes": {
            "value": 5478221
          }
        }
      ]
    }
  }
}

若要在不排序的情况下截断结果,请省略 sort 参数。

GET opensearch_dashboards_sample_data_logs/_search
{
  "size": 0,
  "aggs": {
    "sales_per_month": {
      "date_histogram": {
        "field": "@timestamp",
        "calendar_interval": "month"
      },
      "aggs": {
        "total_bytes": {
          "sum": {
            "field": "bytes"
          }
        },
        "bytes_bucket_sort": {
          "bucket_sort": {
            "from": 1,
            "size": 2
          }
        }
      }
    }
  }
}

剩余 350 字符

有问题?

想要贡献?