Link Search Menu Expand Document Documentation Menu

指标参考

性能分析器提供了许多指标来帮助您评估性能。下表描述了可用的指标,并按与该指标最相关的维度进行分组。所有指标都支持 avgsumminmax 聚合,尽管对于某些指标,无论聚合类型如何,测量值都相同。

有关每个维度的信息,请参阅本主题后面的维度参考

此列表很长。我们建议使用 Ctrl/Cmd + F 查找您要找的内容。

相关维度:ShardIDIndexNameOperationShardRole

度量 描述
CPU_Utilization CPU 使用率。过去五秒内相关线程使用的 CPU 时间(毫秒),除以 5000 毫秒。
Paging_MajfltRate 过去五秒内每秒的主要缺页错误数。主要缺页错误要求进程从磁盘加载内存页。
Paging_MinfltRate 过去五秒内每秒的次要缺页错误数。次要缺页错误不要求进程从磁盘加载内存页。
Paging_RSS 进程在实际内存中拥有的页数——计入文本、数据或堆栈空间的页。此数字不包括尚未按需加载或已交换出去的页。
Sched_Runtime 每个上下文切换在 CPU 上执行的时间(秒)。
Sched_Waittime 每个上下文切换在运行队列中等待的时间(秒)。
Sched_CtxRate 过去五秒内每秒在 CPU 上运行的次数。
Heap_AllocRate 过去 5 秒内每秒分配的堆内存(以字节为单位)的近似值。
IO_ReadThroughput 过去五秒内每秒读取的字节数。
IO_WriteThroughput 过去五秒内每秒写入的字节数。
IO_TotThroughput 过去五秒内每秒读取或写入的字节数。
IO_ReadSyscallRate 过去五秒内每秒的读取系统调用次数。
IO_WriteSyscallRate 过去五秒内每秒的写入系统调用次数。
IO_TotalSyscallRate 过去五秒内每秒的读取和写入系统调用次数。
Thread_Blocked_Time 相关线程被阻止进入或重新进入监视器的平均时间(秒)。
Thread_Blocked_Event 相关线程被阻止进入或重新进入监视器的总次数(即线程处于 blocked 状态的次数)。
Thread_Waited_Time 相关线程等待进入或重新进入监视器的平均时间(秒)(即线程处于 WAITINGTIMED_WAITING 状态的时间)。
Thread_Waited_Event 相关线程等待进入或重新进入监视器的总次数(即线程处于 WAITINGTIMED_WAITING 状态的次数)。
ShardEvents 过去五秒内在分片上执行的事件总数。
ShardBulkDocs 过去五秒内索引的文档总数。

相关维度:ShardIDIndexName

度量 描述
Indexing_ThrottleTime 过去五秒内索引处于合并限流控制下的时间(毫秒)。
Cache_Query_Hit 过去五秒内查询缓存中的成功查找次数。
Cache_Query_Miss 过去五秒内查询缓存中未能检索到 DocIdSet 的查找次数。DocIdSet 是 Lucene 中的一组文档 ID。
Cache_Query_Size 查询缓存内存大小(字节)。
Cache_FieldData_Eviction 过去五秒内 OpenSearch 将数据从 fielddata 堆空间逐出的次数(发生在堆空间已满时)。
Cache_FieldData_Size Fielddata 内存大小(字节)。
Cache_Request_Hit 过去五秒内分片请求缓存中的成功查找次数。
Cache_Request_Miss 过去五秒内请求缓存中未能检索到搜索请求结果的查找次数。
Cache_Request_Eviction 过去五秒内 OpenSearch 将数据从分片请求缓存逐出的次数(发生在请求缓存已满时)。
Cache_Request_Size 分片请求缓存内存大小(字节)。

相关维度:ShardIDIndexNameIndexingStage

度量 描述
Indexing_Pressure_Current_Limits 在特定索引阶段(协调、主或副本)中,索引分片可用的总堆大小(以字节为单位)。
Indexing_Pressure_Current_Bytes 在特定索引阶段(协调、主或副本)中,索引分片占用的总堆大小(以字节为单位)。
Indexing_Pressure_Last_Successful_Timestamp 在特定索引阶段(协调、主或副本)中索引分片成功请求的时间戳。
Indexing_Pressure_Rejection_Count OpenSearch 为特定索引阶段(协调、主或副本)中的索引分片执行的拒绝总数。
Indexing_Pressure_Average_Window_Throughput 在特定索引阶段(协调、主或副本)中,索引分片最后 n 个请求的平均吞吐量(n 的值由 shard_indexing_pressure.secondary_parameter.throughput.request_size_window 设置决定)。

相关维度:OperationExceptionIndicesHTTPRespCodeShardIDIndexNameShardRole

度量 描述
Latency 请求的延迟(毫秒)。

相关维度:MemType

度量 描述
GC_Collection_Event 过去五秒内发生的垃圾回收次数。
GC_Collection_Time 过去五秒内所有垃圾回收的近似累积时间(毫秒)。
Heap_Committed 为 JVM 使用而提交的内存量(字节)。
Heap_Init JVM 最初向操作系统请求用于内存管理的内存量(字节)。
Heap_Max 可用于内存管理的最大内存量(字节)。
Heap_Used 已使用的内存量(字节)。

相关维度:DiskName

度量 描述
Disk_Utilization 磁盘利用率:过去五秒内 OpenSearch 进程读写磁盘所占时间的百分比。
Disk_WaitTime 过去五秒内读写操作的平均持续时间(毫秒)。
Disk_ServiceRate 服务速率:过去五秒内每秒读写兆字节数。此指标假设每个磁盘扇区存储 512 字节。

相关维度:DestAddr

度量 描述
Net_TCP_NumFlows 已收集的样本数量。Performance Analyzer 每 5 秒收集 1 个样本。
Net_TCP_TxQ 发送缓冲区中 TCP 数据包的平均数量。
Net_TCP_RxQ 接收缓冲区中 TCP 数据包的平均数量。
Net_TCP_Lost 未恢复的重复超时平均数量。当恢复完成或 `SND.UNA` 前进时,此数字将重置。`SND.UNA` 是已发送但尚未确认的数据的第一个字节的序列号。
Net_TCP_SendCWND 发送拥塞窗口的平均大小(字节)。
Net_TCP_SSThresh 慢启动大小阈值的平均大小(字节)。

相关维度:Direction

度量 描述
Net_PacketRate4 每秒通过/从接口传输/接收的 IPv4 数据报总数,包括传输或接收错误的。
Net_PacketDropRate4 每秒传输或接收错误的 IPv4 数据报总数。
Net_PacketRate6 每秒通过/从接口传输/接收的 IPv6 数据报总数,包括传输或接收错误的。
Net_PacketDropRate6 每秒传输或接收错误的 IPv6 数据报总数。
Net_Throughput 所有网络接口每秒传输或接收的位数。

相关维度:ThreadPoolType

度量 描述
ThreadPool_QueueSize 任务队列的大小。
ThreadPool_RejectedReqs 被拒绝的执行次数。
ThreadPool_TotalThreads 线程池中当前的线程数。
ThreadPool_ActiveThreads 正在积极执行任务的近似线程数。
ThreadPool_QueueLatency 任务队列的延迟。
ThreadPool_QueueCapacity 任务队列的当前容量。

相关维度:ClusterManager_PendingTaskType

度量 描述
ClusterManager_PendingQueueSize 集群状态更新线程中当前挂起任务的数量。每个节点都有一个集群状态更新线程,负责提交集群状态更新任务,例如创建索引、更新映射、分配分片和分片故障。

相关维度:OperationExceptionIndicesHTTPRespCode

度量 描述
HTTP_RequestDocs 请求中的项目数量(仅适用于 `_bulk` 请求类型)。
HTTP_TotalRequests 过去 5 秒内完成的请求数量。

相关维度:CBType

度量 描述
CB_EstimatedSize 当前估计的字节数。
CB_TrippedEvents 断路器跳闸的次数。
CB_ConfiguredSize 操作可使用的内存量限制(字节)。

相关维度:ClusterManagerTaskInsertOrderClusterManagerTaskPriorityClusterManagerTaskTypeClusterManagerTaskMetadata

度量 描述
ClusterManager_Task_Queue_Time 集群管理器任务在队列中花费的时间量(毫秒)。
ClusterManager_Task_Run_Time 集群管理器任务已运行的时间量(毫秒)。

相关维度:CacheType

度量 描述
Cache_MaxSize 缓存的最大大小(字节)。

相关维度:ControllerName

度量 描述
AdmissionControl_RejectionCount 准入控制控制器执行的拒绝总数。
AdmissionControl_CurrentValue 准入控制控制器的当前值。
AdmissionControl_ThresholdValue 准入控制控制器的阈值。

相关维度:NodeID

度量 描述
Data_RetryingPendingTasksCount 数据节点正在主动执行重试的被限制的挂起任务数量。这是该时间点的绝对指标。
ClusterManager_ThrottledPendingTasksCount 集群管理器节点限制的总挂起任务数之和。这是一个累积指标,请务必检查最大聚合值。

相关维度:N/A

以下指标与整个集群相关,不需要特定维度。

度量 描述
Election_Term 随着每次集群管理器选举单调递增的数字。
PublishClusterState_Latency 节点仲裁发布新集群状态所花费的时间量。此指标适用于当前集群管理器。
PublishClusterState_Failure 新集群状态在集群管理器节点上发布失败的次数。
ClusterApplierService_Latency 每个节点应用集群管理器发送的集群状态所花费的时间量。
ClusterApplierService_Failure 每个节点上应用集群状态操作失败的次数。

相关维度:IndexNameNodeNameShardTypeShardID

度量 描述
Shard_State 每个分片的状态,例如 `STARTED`、`UNASSIGNED` 或 `RELOCATING`。

相关维度:NodeIDsearchbp_mode

度量 描述
SearchBP_Shard_Stats_CancellationCount 在分片任务级别标记为取消的任务数量。
SearchBP_Shard_Stats_LimitReachedCount 在分片任务级别,可取消任务总数超过设定的取消阈值的次数。
SearchBP_Shard_Stats_Resource_Heap_Usage_CancellationCount 自节点上次重启以来,因堆使用量过高而在分片任务级别标记为取消的任务数量。
SearchBP_Shard_Stats_Resource_Heap_Usage_CurrentMax 在分片任务级别当前运行任务的最大堆使用量。
SearchBP_Shard_Stats_Resource_Heap_Usage_RollingAvg 在分片任务级别,最近 _n_ 个任务的滚动平均堆使用量。_n_ 的默认值为 `100`。
SearchBP_Shard_Stats_Resource_CPU_Usage_CancellationCount 自节点上次重启以来,因 CPU 使用量过高而在分片任务级别标记为取消的任务数量。
SearchBP_Shard_Stats_Resource_CPU_Usage_CurrentMax 在分片任务级别,节点上当前运行的所有任务的最大 CPU 时间。
SearchBP_Shard_Stats_Resource_CPU_Usage_CurrentAvg 在分片任务级别,节点上当前运行的所有任务的平均 CPU 时间。
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CancellationCount 自节点上次重启以来,因已用时间过长而在分片任务级别标记为取消的任务数量。
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CurrentMax 在分片任务级别,节点上当前运行的所有任务的最长已用时间。
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CurrentAvg 在分片任务级别,节点上当前运行的所有任务的平均已用时间。
Searchbp_Task_Stats_CancellationCount 在搜索任务级别标记为取消的任务数量。
SearchBP_Task_Stats_LimitReachedCount 在搜索任务级别,可取消任务总数超过设定的取消阈值的次数。
SearchBP_Task_Stats_Resource_Heap_Usage_CancellationCount 自节点上次重启以来,因堆使用量过高而在搜索任务级别标记为取消的任务数量。
SearchBP_Task_Stats_Resource_Heap_Usage_CurrentMax 在搜索任务级别当前运行任务的最大堆使用量。
SearchBP_Task_Stats_Resource_Heap_Usage_RollingAvg 在搜索任务级别,最近 _n_ 个任务的滚动平均堆使用量。_n_ 的默认值为 `10`。
SearchBP_Task_Stats_Resource_CPU_Usage_CancellationCount 自节点上次重启以来,因 CPU 使用量过高而在搜索任务级别标记为取消的任务数量。
SearchBP_Task_Stats_Resource_CPU_Usage_CurrentMax 在搜索任务级别,节点上当前运行的所有任务的最大 CPU 时间。
SearchBP_Task_Stats_Resource_CPU_Usage_CurrentAvg 在搜索任务级别,节点上当前运行的所有任务的平均 CPU 时间。
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CancellationCount 自节点上次重启以来,因已用时间过长而在搜索任务级别标记为取消的任务数量。
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CurrentMax 在搜索任务级别,节点上当前运行的所有任务的最长已用时间。
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CurrentAvg 在搜索任务级别,节点上当前运行的所有任务的平均已用时间。

维度参考

维度 返回值
ShardID 分片的 ID,例如 1
IndexName 索引的名称,例如 my-index
Operation 操作类型,例如 shardbulk
ShardRole 分片角色,例如 primaryreplica
Exception OpenSearch 异常,例如 org.opensearch.index_not_found_exception
Indices 请求 URL 中的索引列表。
HTTPRespCode OpenSearch 响应代码,例如 200
MemType 内存类型,例如 totYoungGCtotFullGCSurvivorPermGenOldGenEdenNonHeapHeap
DiskName 磁盘名称,例如 sda1
DestAddr 目标地址,例如 010015AC
Direction 方向,例如 inout
ThreadPoolType OpenSearch 线程池,例如 indexsearchsnapshot
CBType 断路器类型,例如 accountingfielddatain_flight_requestsparentrequest
ClusterManagerTaskInsertOrder 任务插入的顺序,例如 3691
ClusterManagerTaskPriority 任务的优先级,例如 URGENT。OpenSearch 会在低优先级任务之前执行高优先级任务,无论 insert_order 如何。
ClusterManagerTaskType 任务类型,例如 shard-startedcreate-indexdelete-indexrefresh-mappingput-mappingCleanupSnapshotRestoreStateUpdate snapshot state
ClusterManagerTaskMetadata 任务的元数据(如果有)。
CacheType 缓存类型,例如 Field_Data_CacheShard_Request_CacheNode_Query_Cache
NodeID 节点的 ID。
Searchbp_mode 搜索背压模式,例如 monitor_only(默认)、enforceddisabled