欢迎来到重庆监控安装公司官方网站!
您的位置: 重庆监控安装公司 - 安防百科 - 弹性云主机支持的操作系统监控指标(安装Agent)

弹性云主机支持的操作系统监控指标(安装Agent)

来源:安防百科 / 时间: 2024-05-28

通过在弹性云主机中安装Agent插件,可以为用户提供服务器的系统级、主动式、细颗粒度监控服务。本节定义了弹性云主机上报云监控的操作系统监控指标。

操作系统监控目前支持的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、网卡类相关监控项、NTP类相关监控项、TCP连接数类相关监控、GPU相关监控项。

安装Agent后,您便可以查看弹性云主机的操作系统监控指标。指标采集周期是1分钟。

对于不同的操作系统、不同的弹性云主机类型,在安装Agent后均默认支持查看以下监控指标。

CPU相关监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
cpu_usage_idle (Agent)CPU空闲时间占比 该指标用于统计测量对象当前CPU空闲时间占比。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU空闲时间占比。
采集方式(Windows):用户可以通过top命令查看 %Cpu(s) id值。
0-100% 云主机 1分钟
cpu_usage_other (Agent)其他CPU使用率 该指标用于统计测量对象其他占用CPU使用率。
单位:百分比
采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。
采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。
0-100% 云主机 1分钟
cpu_usage_system (Agent)内核空间CPU使用率 该指标用于统计测量对象当前内核空间占用CPU使用率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出内核空间CPU使用率。用户可以通过top命令查看 %Cpu(s) sy值。
采集方式(Windows):通过WindowsAPI GetSystemTimes获取。
0-100% 云主机 1分钟
cpu_usage_user (Agent)用户空间CPU使用率 该指标用于统计测量对象当前用户空间占用CPU使用率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s) us值。
采集方式(Windows):通过WindowsAPI GetSystemTimes获取。
0-100% 云主机 1分钟
cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s)值。
采集方式(Windows):通过WindowsAPI GetSystemTimes获取。
0-100% 云主机 1分钟
cpu_usage_nice (Agent)Nice进程CPU使用率 该指标用于统计测量对象当前Nice进程CPU使用率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出Nice进程CPU使用率。用户可以通过top命令查看 %Cpu(s) ni值。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
cpu_usage_iowait (Agent)iowait状态占比 该指标用于统计测量对象当前iowait状态占用CPU的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出iowait状态占比。用户可以通过top命令查看 %Cpu(s) wa值。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
cpu_usage_irq (Agent)CPU中断时间占比 该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU中断时间占比。用户可以通过top命令查看 %Cpu(s) hi值。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
cpu_usage_softirq (Agent)CPU软中断时间占比 该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU软中断时间占比。用户可以通过top命令查看 %Cpu(s) si值。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟

CPU负载指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
load_average1 (Agent) 1分钟平均负载 该指标用于统计测量对象过去1分钟的CPU平均负载。
采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。
≥0 云主机 1分钟
load_average5 (Agent) 5分钟平均负载 该指标用于统计测量对象过去5分钟的CPU平均负载。
采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。
≥0 云主机 1分钟
load_average15 (Agent) 15分钟平均负载 该指标用于统计测量对象过去15分钟的CPU平均负载。
采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。
≥0 云主机 1分钟

Windows系统暂不支持CPU负载指标。

内存相关监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
mem_available (Agent)可用内存 该指标用于统计测量对象的可用内存。
单位:GB
采集方式(Linux):通过/proc/meminfo得到MemAvailable;若/proc/meminfo中不显示MemAvailable,则MemAvailable=MemFree+Buffers+Cached
采集方式(Windows):计算方法为(内存总量-已用内存量)。通过WindowsAPI GlobalMemoryStatusEx获取。
≥0 GB 云主机 1分钟
mem_usedPercent (Agent)内存使用率 该指标用于统计测量对象的内存使用率。
单位:百分比
采集方式(Linux):通过/proc/meminfo文件获取,(MemTotal-MemAvailable)/MemTotal
采集方式(Windows):计算方法为( 已用内存量/内存总量*100%)。
0-100% 云主机 1分钟
mem_free (Agent)空闲内存量 该指标用于统计测量对象的空闲内存量。
单位:GB
采集方式(Linux):通过/proc/meminfo获取。
采集方式(Windows):暂不支持。
≥0 GB 云主机 1分钟
mem_buffers (Agent)Buffers占用量 该指标用于统计测量对象的Buffers内存量。
单位:GB
采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Mem:buffers值。
采集方式(Windows):暂不支持。
≥0 GB 云主机 1分钟
mem_cached (Agent)Cache占用量 该指标用于统计测量对象Cache内存量。
单位:GB
采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Swap:cached Mem值。
采集方式(Windows):暂不支持。
≥0 GB 云主机 1分钟
total_open_files (Agent)所有进程使用的句柄总和 该指标用于统计测量对象的所有进程使用的句柄总和。单位:个采集方式(Linux):通过/proc/{pid}/fd文件汇总所有进程使用的句柄数。采集方式(Windows):暂不支持。 ≥0 GB 云主机 1分钟

磁盘相关监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
mountPointPrefix_disk_free (Agent)磁盘剩余存储量 该指标用于统计测量对象磁盘的剩余存储空间。
单位:GB
采集方式(Linux):执行df -h命令,查看Avail列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
≥0 GB 云主机 1分钟
mountPointPrefix_disk_total (Agent)磁盘存储总量 该指标用于统计测量对象磁盘存储总量。
单位:GB
采集方式(Linux):执行df -h命令,查看Size列数据。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
≥0 GB 云主机 1分钟
mountPointPrefix_disk_used (Agent)磁盘已用存量 该指标用于统计测量对象磁盘的已用存储空间。
单位:GB
采集方式(Linux):执行df -h命令,查看Used列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
≥0 GB 云主机 1分钟
mountPointPrefix_disk_usedPercent (Agent)磁盘使用率 该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。
单位:百分比
采集方式(Linux):通过计算Used/Size得出。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
0-100% 云主机 1分钟

磁盘I/O相关监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
mountPointPrefix_disk_agt_read_bytes_rate (Agent)磁盘读速率 该指标用于统计每秒从测量对象读出数据量。
单位:byte/s
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):
使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
高CPU情况下存在获取超时的现象,会导致无法获取监控数据。
≥ 0 bytes/s 云主机 1分钟
mountPointPrefix_disk_agt_read_requests_rate (Agent)磁盘读操作速率 该指标用于统计每秒从测量对象读取数据的请求次数。
单位:请求/秒
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):
使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
高CPU情况下存在获取超时的现象,会导致无法获取监控数据。
≥ 0 Requests/s 云主机 1分钟
mountPointPrefix_disk_agt_write_bytes_rate (Agent)磁盘写速率 该指标用于统计每秒写到测量对象的数据量。
单位:byte/s
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):
使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
高CPU情况下存在获取超时的现象,会导致无法获取监控数据。
≥ 0 bytes/s 云主机 1分钟
mountPointPrefix_disk_agt_write_requests_rate (Agent)磁盘写操作速率 该指标用于统计每秒向测量对象写数据的请求次数。
单位:请求/秒
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
采集方式(Windows):
使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./。
高CPU情况下存在获取超时的现象,会导致无法获取监控数据。
≥ 0 Requests/s 云主机 1分钟
disk_readTime (Agent)读操作平均耗时 该指标用于统计测量对象磁盘读操作平均耗时。
单位:ms/count
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 ms/count 云主机 1分钟
disk_writeTime (Agent)写操作平均耗时 该指标用于统计测量对象磁盘写操作平均耗时。
单位:ms/count
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 ms/count 云主机 1分钟
disk_ioUtils (Agent)磁盘I/O使用率 该指标用于统计测量对象磁盘I/O使用率。
单位:百分比
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
disk_queue_length (Agent)平均队列长度 该指标用于统计指定时间段内,平均等待完成的读取或写入操作请求的数量
单位:个
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化得出磁盘平均队列长度。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 Counts 云主机 1分钟
disk_write_bytes_per_operation (Agent)平均写操作大小 该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。
单位:byte/op
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 ms/op 云主机 1分钟
disk_read_bytes_per_operation (Agent)平均读操作大小 该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。
单位:byte/op
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 KB/op 云主机 1分钟
disk_io_svctm (Agent)平均I/O服务时长 该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。
单位:ms/op
采集方式(Linux):
通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。
挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
采集方式(Windows):暂不支持。
≥ 0 ms/op 云主机 1分钟

文件系统类监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
disk_fs_rwstate (Agent)文件系统读写状态 该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。
采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。
0,1 云主机 1分钟
disk_inodesTotal (Agent)inode空间大小 该指标用于统计测量对象当前磁盘的inode空间量。
采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
≥ 0 云主机 1分钟
disk_inodesUsed (Agent)inode已使用空间 该指标用于统计测量对象当前磁盘已使用的inode空间量。
采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
≥ 0 云主机 1分钟
disk_inodesUsedPercent (Agent)inode已使用占比 该指标用于统计测量对象当前磁盘已使用的inode占比。
单位:百分比
采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
0-100% 云主机 1分钟

Windows系统暂不支持文件系统类监控指标。

网卡相关监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
net_bitRecv (Agent)出网带宽 该指标用于统计测量对象网卡每秒发送的比特数。
单位:bit/s
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。
≥ 0 bits/s 云主机 1分钟
net_bitSent (Agent)入网带宽 该指标用于统计测量对象网卡每秒接收的比特数。
单位:bit/s
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。
≥ 0 bits/s 云主机 1分钟
net_packetRecv (Agent)网卡包接收速率 该指标用于统计测量对象网卡每秒接收的数据包数。
单位:Count/s
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。
≥ 0 counts/s 云主机 1分钟
net_packetSent (Agent)网卡包发送速率 该指标用于统计测量对象网卡每秒发送的数据包数。
单位:Count/s
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。
≥ 0 counts/s 云主机 1分钟
net_errin (Agent)接收误包率 该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
net_errout (Agent)发送误包率 该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
net_dropin (Agent)接收丢包率 该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟
net_dropout (Agent)发送丢包率 该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。
单位:百分比
采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
采集方式(Windows):暂不支持。
0-100% 云主机 1分钟

进程类监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
proc_pHashId_cpu 进程CPU使用率 进程消耗的CPU百分比,pHashId是(进程名+进程ID)的md5值。
单位:百分比
采集方式(Linux):通过计算/proc/pid/stat的变化得出。
采集方式(Windows):通过Windows API GetProcessTimes获取进程CPU使用率。
0-100% 云主机 1分钟
proc_pHashId_mem 进程内存使用率 进程消耗的内存百分比,pHashId是(进程名+进程ID)的md5值。
单位:百分比
采集方式(Linux):
RSS*PAGESIZE/MemTotal
RSS: 通过获取/proc/pid/statm第二列得到
PAGESIZE: 通过命令getconf PAGESIZE获取
MemTotal:通过/proc/meminfo获取
采集方式(Windows):使用Windows API procGlobalMemoryStatusEx获取内存总量,通过GetProcessMemoryInfo获取内存已使用量,计算两者比值得到内存使用率。
0-100% 云主机 1分钟
proc_pHashId_file 进程打开文件数 进程打开文件数,pHashId是(进程名+进程ID)的md5值。
采集方式(Linux):通过执行ls -l /proc/pid/fd 可以查看数量。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_running_count 运行中进程数 该指标用于统计测量对象处于运行状态的进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_idle_count 空闲进程数 该指标用于统计测量对象处于空闲状态的进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_zombie_count 僵死进程数 该指标用于统计测量对象处于僵死状态的进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_blocked_count 阻塞进程数 该指标用于统计测量对象被阻塞的进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_sleeping_count 睡眠进程数 该指标用于统计测量对象处于睡眠状态的进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):暂不支持。
≥0 云主机 1分钟
proc_total_count 系统进程数 该指标用于统计测量对象的总进程数。
采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
采集方式(Windows):通过psapi.dll系统进程状态支持模块得到进程总数。
≥0 云主机 1分钟

TCP类监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
net_tcp_total (Agent) TCP TOTAL 该指标用于统计测量对象所有状态的TCP连接数总和。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_established (Agent) TCP ESTABLISHED 该指标用于统计测量对象处于ESTABLISHED状态的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_sys_sent (Agent) TCP SYS_SENT 该指标用于统计测量对象处于请求连接状态的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_sys_recv (Agent) TCP SYS_RECV 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_fin_wait1 (Agent) TCP FIN_WAIT1 该指标用于统计测量对象客户端主动关闭且没有收到服务端ACK的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_fin_wait2 (Agent) TCP FIN_WAIT2 该指标用于统计测量对象处于FIN_WAIT2状态的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_close (Agent) TCP CLOSE 该指标用于统计测量对象关闭的或未打开的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_last_ack (Agent) TCP LAST_ACK 该指标用于统计测量对象被动关闭等待ACK报文的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_listen (Agent) TCP LISTEN 该指标用于统计测量对象处于LISTEN状态的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_closing (Agent) TCP CLOSING 该指标用于统计测量对象处于服务端和客户端同时主动关闭状态的TCP连接数量。单位:个l采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。l采集方式(Windows):通过WindowsAPI GetTcpTable2获取。 ≥ 0 云主机 1分钟
net_tcp_retrans (Agent) TCP重传率 该指标用于统计测量对象重新发送的报文数与总发送的报文数之间的比值。单位:百分比l采集方式(Linux):通过从/proc/net/snmp文件中获取对应的数据,计算采集周期内数据的变化并做比得出。l采集方式(Windows):重传率通过WindowsAPI GetTcpStatistics获取 0-100% 云主机 1分钟

GPU类监控指标说明

指标 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标)
gpu_status gpu健康状态 该指标用于统计虚拟机上GPU健康状态,是一个综合指标。该指标无单位。采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0:代表健康1:代表亚健康2:代表故障 GPU云主机 1分钟
gpu_usage_encoder 编码使用率 该指标用于统计该GPU的编码能力使用率。单位:百分比采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% GPU云主机 1分钟
gpu_usage_decoder 解码使用率 该指标用于统计该GPU的解码能力使用率。单位:百分比采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% GPU云主机 1分钟
gpu_volatile_correctable 可纠正ECC错误数量 该指标用于统计该GPU重置以来可纠正的ECC错误数量,每次重置后归0。单位:个。采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_volatile_uncorrectable 不可纠正ECC错误数量 该指标用于统计该GPU重置以来不可纠正的ECC错误数量,每次重置后归0。单位:个采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_aggregate_correctable 累计可纠正ECC错误数量 该指标用于统计该GPU累计的可纠正ECC错误数量。单位:个采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_aggregate_uncorrectable 累计不可纠正ECC错误数量 该指标用于统计该GPU累计的不可纠正ECC错误数量。单位:个采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_retired_page_single_bit retired page single bit错误数量 该指标用于统计该GPU当前卡隔离的单比特页的数量。单位:个采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_retired_page_double_bit retired page double bit错误数量 该指标用于统计该GPU当前卡隔离的双比特页的数量。单位:个采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 ≥ 0 GPU云主机 1分钟
gpu_performance_state (Agent) 性能状态 该指标用于统计测量对象当前的GPU性能状态。该指标无单位。采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 P0-P15、P32,P0表示最大性能状态,P15表示最小性能状态,P32表示状态未知。 GPU云主机 1分钟
gpu_usage_mem (Agent) 显存使用率 该指标用于统计测量对象当前的显存使用率。单位:百分比采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% GPU云主机 1分钟
gpu_usage_gpu (Agent) GPU使用率 该指标用于统计测量对象当前的GPU使用率。单位:百分比采集方式(Linux):通过调用GPU卡的libnvidia-ml.so.1库文件获取。采集方式(Windows):通过调用GPU卡的nvml.dll库获取。 0-100% GPU云主机 1分钟
Key Value
instance_id 云主机ID

相关产品

在线客服
微信联系
客服
扫码加微信(手机同号)
电话咨询
返回顶部