指标参考
性能分析器提供了许多指标来帮助您评估性能。下表描述了可用的指标,并按与该指标最相关的维度进行分组。所有指标都支持 avg
、sum
、min
和 max
聚合,尽管对于某些指标,无论聚合类型如何,测量值都相同。
有关每个维度的信息,请参阅本主题后面的维度参考。
此列表很长。我们建议使用 Ctrl/Cmd + F 查找您要找的内容。
相关维度:ShardID
、IndexName
、Operation
、ShardRole
度量 | 描述 |
CPU_Utilization | CPU 使用率。过去五秒内相关线程使用的 CPU 时间(毫秒),除以 5000 毫秒。 |
Paging_MajfltRate | 过去五秒内每秒的主要缺页错误数。主要缺页错误要求进程从磁盘加载内存页。 |
Paging_MinfltRate | 过去五秒内每秒的次要缺页错误数。次要缺页错误不要求进程从磁盘加载内存页。 |
Paging_RSS | 进程在实际内存中拥有的页数——计入文本、数据或堆栈空间的页。此数字不包括尚未按需加载或已交换出去的页。 |
Sched_Runtime | 每个上下文切换在 CPU 上执行的时间(秒)。 |
Sched_Waittime | 每个上下文切换在运行队列中等待的时间(秒)。 |
Sched_CtxRate | 过去五秒内每秒在 CPU 上运行的次数。 |
Heap_AllocRate | 过去 5 秒内每秒分配的堆内存(以字节为单位)的近似值。 |
IO_ReadThroughput | 过去五秒内每秒读取的字节数。 |
IO_WriteThroughput | 过去五秒内每秒写入的字节数。 |
IO_TotThroughput | 过去五秒内每秒读取或写入的字节数。 |
IO_ReadSyscallRate | 过去五秒内每秒的读取系统调用次数。 |
IO_WriteSyscallRate | 过去五秒内每秒的写入系统调用次数。 |
IO_TotalSyscallRate | 过去五秒内每秒的读取和写入系统调用次数。 |
Thread_Blocked_Time | 相关线程被阻止进入或重新进入监视器的平均时间(秒)。 |
Thread_Blocked_Event | 相关线程被阻止进入或重新进入监视器的总次数(即线程处于 blocked 状态的次数)。 |
Thread_Waited_Time | 相关线程等待进入或重新进入监视器的平均时间(秒)(即线程处于 WAITING 或 TIMED_WAITING 状态的时间)。 |
Thread_Waited_Event | 相关线程等待进入或重新进入监视器的总次数(即线程处于 WAITING 或 TIMED_WAITING 状态的次数)。 |
ShardEvents | 过去五秒内在分片上执行的事件总数。 |
ShardBulkDocs | 过去五秒内索引的文档总数。 |
相关维度:ShardID
、IndexName
度量 | 描述 |
Indexing_ThrottleTime | 过去五秒内索引处于合并限流控制下的时间(毫秒)。 |
Cache_Query_Hit | 过去五秒内查询缓存中的成功查找次数。 |
Cache_Query_Miss | 过去五秒内查询缓存中未能检索到 DocIdSet 的查找次数。DocIdSet 是 Lucene 中的一组文档 ID。 |
Cache_Query_Size | 查询缓存内存大小(字节)。 |
Cache_FieldData_Eviction | 过去五秒内 OpenSearch 将数据从 fielddata 堆空间逐出的次数(发生在堆空间已满时)。 |
Cache_FieldData_Size | Fielddata 内存大小(字节)。 |
Cache_Request_Hit | 过去五秒内分片请求缓存中的成功查找次数。 |
Cache_Request_Miss | 过去五秒内请求缓存中未能检索到搜索请求结果的查找次数。 |
Cache_Request_Eviction | 过去五秒内 OpenSearch 将数据从分片请求缓存逐出的次数(发生在请求缓存已满时)。 |
Cache_Request_Size | 分片请求缓存内存大小(字节)。 |
相关维度:ShardID
、IndexName
、IndexingStage
度量 | 描述 |
Indexing_Pressure_Current_Limits | 在特定索引阶段(协调、主或副本)中,索引分片可用的总堆大小(以字节为单位)。 |
Indexing_Pressure_Current_Bytes | 在特定索引阶段(协调、主或副本)中,索引分片占用的总堆大小(以字节为单位)。 |
Indexing_Pressure_Last_Successful_Timestamp | 在特定索引阶段(协调、主或副本)中索引分片成功请求的时间戳。 |
Indexing_Pressure_Rejection_Count | OpenSearch 为特定索引阶段(协调、主或副本)中的索引分片执行的拒绝总数。 |
Indexing_Pressure_Average_Window_Throughput | 在特定索引阶段(协调、主或副本)中,索引分片最后 n 个请求的平均吞吐量(n 的值由 shard_indexing_pressure.secondary_parameter.throughput.request_size_window 设置决定)。 |
相关维度:Operation
、Exception
、Indices
、HTTPRespCode
、ShardID
、IndexName
、ShardRole
相关维度:MemType
度量 | 描述 |
GC_Collection_Event | 过去五秒内发生的垃圾回收次数。 |
GC_Collection_Time | 过去五秒内所有垃圾回收的近似累积时间(毫秒)。 |
Heap_Committed | 为 JVM 使用而提交的内存量(字节)。 |
Heap_Init | JVM 最初向操作系统请求用于内存管理的内存量(字节)。 |
Heap_Max | 可用于内存管理的最大内存量(字节)。 |
Heap_Used | 已使用的内存量(字节)。 |
相关维度:DiskName
度量 | 描述 |
Disk_Utilization | 磁盘利用率:过去五秒内 OpenSearch 进程读写磁盘所占时间的百分比。 |
Disk_WaitTime | 过去五秒内读写操作的平均持续时间(毫秒)。 |
Disk_ServiceRate | 服务速率:过去五秒内每秒读写兆字节数。此指标假设每个磁盘扇区存储 512 字节。 |
相关维度:DestAddr
度量 | 描述 |
Net_TCP_NumFlows | 已收集的样本数量。Performance Analyzer 每 5 秒收集 1 个样本。 |
Net_TCP_TxQ | 发送缓冲区中 TCP 数据包的平均数量。 |
Net_TCP_RxQ | 接收缓冲区中 TCP 数据包的平均数量。 |
Net_TCP_Lost | 未恢复的重复超时平均数量。当恢复完成或 `SND.UNA` 前进时,此数字将重置。`SND.UNA` 是已发送但尚未确认的数据的第一个字节的序列号。 |
Net_TCP_SendCWND | 发送拥塞窗口的平均大小(字节)。 |
Net_TCP_SSThresh | 慢启动大小阈值的平均大小(字节)。 |
相关维度:Direction
度量 | 描述 |
Net_PacketRate4 | 每秒通过/从接口传输/接收的 IPv4 数据报总数,包括传输或接收错误的。 |
Net_PacketDropRate4 | 每秒传输或接收错误的 IPv4 数据报总数。 |
Net_PacketRate6 | 每秒通过/从接口传输/接收的 IPv6 数据报总数,包括传输或接收错误的。 |
Net_PacketDropRate6 | 每秒传输或接收错误的 IPv6 数据报总数。 |
Net_Throughput | 所有网络接口每秒传输或接收的位数。 |
相关维度:ThreadPoolType
度量 | 描述 |
ThreadPool_QueueSize | 任务队列的大小。 |
ThreadPool_RejectedReqs | 被拒绝的执行次数。 |
ThreadPool_TotalThreads | 线程池中当前的线程数。 |
ThreadPool_ActiveThreads | 正在积极执行任务的近似线程数。 |
ThreadPool_QueueLatency | 任务队列的延迟。 |
ThreadPool_QueueCapacity | 任务队列的当前容量。 |
相关维度:ClusterManager_PendingTaskType
度量 | 描述 |
ClusterManager_PendingQueueSize | 集群状态更新线程中当前挂起任务的数量。每个节点都有一个集群状态更新线程,负责提交集群状态更新任务,例如创建索引、更新映射、分配分片和分片故障。 |
相关维度:Operation
、Exception
、Indices
、HTTPRespCode
度量 | 描述 |
HTTP_RequestDocs | 请求中的项目数量(仅适用于 `_bulk` 请求类型)。 |
HTTP_TotalRequests | 过去 5 秒内完成的请求数量。 |
相关维度:CBType
度量 | 描述 |
CB_EstimatedSize | 当前估计的字节数。 |
CB_TrippedEvents | 断路器跳闸的次数。 |
CB_ConfiguredSize | 操作可使用的内存量限制(字节)。 |
度量 | 描述 |
ClusterManager_Task_Queue_Time | 集群管理器任务在队列中花费的时间量(毫秒)。 |
ClusterManager_Task_Run_Time | 集群管理器任务已运行的时间量(毫秒)。 |
相关维度:CacheType
度量 | 描述 |
Cache_MaxSize | 缓存的最大大小(字节)。 |
相关维度:ControllerName
度量 | 描述 |
AdmissionControl_RejectionCount | 准入控制控制器执行的拒绝总数。 |
AdmissionControl_CurrentValue | 准入控制控制器的当前值。 |
AdmissionControl_ThresholdValue | 准入控制控制器的阈值。 |
相关维度:NodeID
度量 | 描述 |
Data_RetryingPendingTasksCount | 数据节点正在主动执行重试的被限制的挂起任务数量。这是该时间点的绝对指标。 |
ClusterManager_ThrottledPendingTasksCount | 集群管理器节点限制的总挂起任务数之和。这是一个累积指标,请务必检查最大聚合值。 |
相关维度:N/A
以下指标与整个集群相关,不需要特定维度。
度量 | 描述 |
Election_Term | 随着每次集群管理器选举单调递增的数字。 |
PublishClusterState_Latency | 节点仲裁发布新集群状态所花费的时间量。此指标适用于当前集群管理器。 |
PublishClusterState_Failure | 新集群状态在集群管理器节点上发布失败的次数。 |
ClusterApplierService_Latency | 每个节点应用集群管理器发送的集群状态所花费的时间量。 |
ClusterApplierService_Failure | 每个节点上应用集群状态操作失败的次数。 |
相关维度:IndexName
、NodeName
、ShardType
、ShardID
度量 | 描述 |
Shard_State | 每个分片的状态,例如 `STARTED`、`UNASSIGNED` 或 `RELOCATING`。 |
相关维度:NodeID
、searchbp_mode
度量 | 描述 |
SearchBP_Shard_Stats_CancellationCount | 在分片任务级别标记为取消的任务数量。 |
SearchBP_Shard_Stats_LimitReachedCount | 在分片任务级别,可取消任务总数超过设定的取消阈值的次数。 |
SearchBP_Shard_Stats_Resource_Heap_Usage_CancellationCount | 自节点上次重启以来,因堆使用量过高而在分片任务级别标记为取消的任务数量。 |
SearchBP_Shard_Stats_Resource_Heap_Usage_CurrentMax | 在分片任务级别当前运行任务的最大堆使用量。 |
SearchBP_Shard_Stats_Resource_Heap_Usage_RollingAvg | 在分片任务级别,最近 _n_ 个任务的滚动平均堆使用量。_n_ 的默认值为 `100`。 |
SearchBP_Shard_Stats_Resource_CPU_Usage_CancellationCount | 自节点上次重启以来,因 CPU 使用量过高而在分片任务级别标记为取消的任务数量。 |
SearchBP_Shard_Stats_Resource_CPU_Usage_CurrentMax | 在分片任务级别,节点上当前运行的所有任务的最大 CPU 时间。 |
SearchBP_Shard_Stats_Resource_CPU_Usage_CurrentAvg | 在分片任务级别,节点上当前运行的所有任务的平均 CPU 时间。 |
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CancellationCount | 自节点上次重启以来,因已用时间过长而在分片任务级别标记为取消的任务数量。 |
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CurrentMax | 在分片任务级别,节点上当前运行的所有任务的最长已用时间。 |
SearchBP_Shard_Stats_Resource_ElaspedTime_Usage_CurrentAvg | 在分片任务级别,节点上当前运行的所有任务的平均已用时间。 |
Searchbp_Task_Stats_CancellationCount | 在搜索任务级别标记为取消的任务数量。 |
SearchBP_Task_Stats_LimitReachedCount | 在搜索任务级别,可取消任务总数超过设定的取消阈值的次数。 |
SearchBP_Task_Stats_Resource_Heap_Usage_CancellationCount | 自节点上次重启以来,因堆使用量过高而在搜索任务级别标记为取消的任务数量。 |
SearchBP_Task_Stats_Resource_Heap_Usage_CurrentMax | 在搜索任务级别当前运行任务的最大堆使用量。 |
SearchBP_Task_Stats_Resource_Heap_Usage_RollingAvg | 在搜索任务级别,最近 _n_ 个任务的滚动平均堆使用量。_n_ 的默认值为 `10`。 |
SearchBP_Task_Stats_Resource_CPU_Usage_CancellationCount | 自节点上次重启以来,因 CPU 使用量过高而在搜索任务级别标记为取消的任务数量。 |
SearchBP_Task_Stats_Resource_CPU_Usage_CurrentMax | 在搜索任务级别,节点上当前运行的所有任务的最大 CPU 时间。 |
SearchBP_Task_Stats_Resource_CPU_Usage_CurrentAvg | 在搜索任务级别,节点上当前运行的所有任务的平均 CPU 时间。 |
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CancellationCount | 自节点上次重启以来,因已用时间过长而在搜索任务级别标记为取消的任务数量。 |
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CurrentMax | 在搜索任务级别,节点上当前运行的所有任务的最长已用时间。 |
SearchBP_Task_Stats_Resource_ElaspedTime_Usage_CurrentAvg | 在搜索任务级别,节点上当前运行的所有任务的平均已用时间。 |
维度参考
维度 | 返回值 |
ShardID | 分片的 ID,例如 1 。 |
IndexName | 索引的名称,例如 my-index 。 |
Operation | 操作类型,例如 shardbulk 。 |
ShardRole | 分片角色,例如 primary 或 replica 。 |
Exception | OpenSearch 异常,例如 org.opensearch.index_not_found_exception 。 |
Indices | 请求 URL 中的索引列表。 |
HTTPRespCode | OpenSearch 响应代码,例如 200 。 |
MemType | 内存类型,例如 totYoungGC 、totFullGC 、Survivor 、PermGen 、OldGen 、Eden 、NonHeap 或 Heap 。 |
DiskName | 磁盘名称,例如 sda1 。 |
DestAddr | 目标地址,例如 010015AC 。 |
Direction | 方向,例如 in 或 out 。 |
ThreadPoolType | OpenSearch 线程池,例如 index 、search 或 snapshot 。 |
CBType | 断路器类型,例如 accounting 、fielddata 、in_flight_requests 、parent 或 request 。 |
ClusterManagerTaskInsertOrder | 任务插入的顺序,例如 3691 。 |
ClusterManagerTaskPriority | 任务的优先级,例如 URGENT 。OpenSearch 会在低优先级任务之前执行高优先级任务,无论 insert_order 如何。 |
ClusterManagerTaskType | 任务类型,例如 shard-started 、create-index 、delete-index 、refresh-mapping 、put-mapping 、CleanupSnapshotRestoreState 或 Update snapshot state 。 |
ClusterManagerTaskMetadata | 任务的元数据(如果有)。 |
CacheType | 缓存类型,例如 Field_Data_Cache 、Shard_Request_Cache 或 Node_Query_Cache 。 |
NodeID | 节点的 ID。 |
Searchbp_mode | 搜索背压模式,例如 monitor_only (默认)、enforced 或 disabled 。 |