扩展统计桶聚合
extended_stats_bucket
聚合是 stats_bucket
同级聚合的更全面版本。除了 stats_bucket
提供的基本统计度量外,extended_stats_bucket
还计算以下指标:
- 平方和
- 方差
- 总体方差
- 样本方差
- 标准差
- 总体标准差
- 样本标准差
- 标准差边界
- 上限
- 下限
- 总体上限
- 总体下限
- 样本上限
- 样本下限
标准差和方差是总体统计量;它们分别始终等于总体标准差和总体方差。
std_deviation_bounds
对象定义了一个范围,该范围跨越平均值上方和下方指定数量的标准差(默认为两个标准差)。此对象始终包含在输出中,但仅对正态分布数据有意义。在解释这些值之前,请验证您的数据集是否遵循正态分布。
指定的指标必须是数值类型,并且同级聚合必须是多桶聚合。
参数
extended_stats_bucket
聚合接受以下参数。
参数 | 必需/可选 | 数据类型 | 描述 |
---|---|---|---|
buckets_path | 必需 | 字符串 | 要聚合的聚合桶的路径。参见桶路径。 |
gap_policy | 可选 | 字符串 | 应用于缺失数据的策略。有效值是 skip 和 insert_zeros 。默认为 skip 。参阅数据间隙。 |
format | 可选 | 字符串 | 一个 DecimalFormat 格式化字符串。将格式化输出返回到聚合的 <stat>_as_string 属性中。 |
sigma | 可选 | 双精度浮点数(非负) | 用于计算 std_deviation_bounds 区间的、高于和低于平均值的标准差数量。默认为 2 。参阅 extended_stats 中的定义边界。 |
示例
以下示例使用 OpenSearch Dashboards 电子商务样本数据创建一个具有一个月间隔的日期直方图。sum
子聚合计算每个月的总字节数。最后,extended_stats_bucket
聚合返回这些总和的扩展统计信息:
GET opensearch_dashboards_sample_data_logs/_search
{
"size": 0,
"aggs": {
"visits_per_month": {
"date_histogram": {
"field": "@timestamp",
"interval": "month"
},
"aggs": {
"sum_of_bytes": {
"sum": {
"field": "bytes"
}
}
}
},
"stats_monthly_bytes": {
"extended_stats_bucket": {
"buckets_path": "visits_per_month>sum_of_bytes",
"sigma": 3,
"format": "0.##E0"
}
}
}
}
示例响应
响应包含所选桶的扩展统计信息。请注意,标准差边界是针对三西格玛范围的;更改 sigma
(或让其默认为 2
)会返回不同的结果:
响应
{
"took": 6,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": {
"value": 10000,
"relation": "gte"
},
"max_score": null,
"hits": []
},
"aggregations": {
"visits_per_month": {
"buckets": [
{
"key_as_string": "2025-03-01T00:00:00.000Z",
"key": 1740787200000,
"doc_count": 480,
"sum_of_bytes": {
"value": 2804103
}
},
{
"key_as_string": "2025-04-01T00:00:00.000Z",
"key": 1743465600000,
"doc_count": 6849,
"sum_of_bytes": {
"value": 39103067
}
},
{
"key_as_string": "2025-05-01T00:00:00.000Z",
"key": 1746057600000,
"doc_count": 6745,
"sum_of_bytes": {
"value": 37818519
}
}
]
},
"stats_monthly_bytes": {
"count": 3,
"min": 2804103,
"max": 39103067,
"avg": 26575229.666666668,
"sum": 79725689,
"min_as_string": "2.8E6",
"max_as_string": "3.91E7",
"avg_as_string": "2.66E7",
"sum_as_string": "7.97E7",
"sum_of_squares": 2967153221794459,
"variance": 282808242095406.25,
"variance_population": 282808242095406.25,
"variance_sampling": 424212363143109.4,
"std_deviation": 16816903.46334325,
"std_deviation_population": 16816903.46334325,
"std_deviation_sampling": 20596416.2694171,
"std_deviation_bounds": {
"upper": 77025940.05669643,
"lower": -23875480.72336309,
"upper_population": 77025940.05669643,
"lower_population": -23875480.72336309,
"upper_sampling": 88364478.47491796,
"lower_sampling": -35214019.141584635
},
"sum_of_squares_as_string": "2.97E15",
"variance_as_string": "2.83E14",
"variance_population_as_string": "2.83E14",
"variance_sampling_as_string": "4.24E14",
"std_deviation_as_string": "1.68E7",
"std_deviation_population_as_string": "1.68E7",
"std_deviation_sampling_as_string": "2.06E7",
"std_deviation_bounds_as_string": {
"upper": "7.7E7",
"lower": "-2.39E7",
"upper_population": "7.7E7",
"lower_population": "-2.39E7",
"upper_sampling": "8.84E7",
"lower_sampling": "-3.52E7"
}
}
}
}