阿里云监控云主机服务器监控指标说明

阿里云资源监控

资源监控是对用户名下云资源的各项指标进行监控。用户可在资源监控列表中选择某资源阿里云,查看其对应的监控图表和报警信息。报警规则配置灵活方便,报警资源支持添加标签组,也支持指定单个或多个阿里云;触发条件支持自定义,同时也支持关联报警模板;通知策略中可指定通知周期、有效通知时段、通知条件、接受渠道等信息。当报警规则关联的资源阿里云其监控指标达到告警阈值时,则向指定的联系人或联系组发送通知,同时也可通过管理控制台报警历史中查询对应的报警记录。

监控指标说明

阿里云为阿里云提供以下监控指标,按采集上报的前提条件来区分,可以分为三类:

  • 由阿里云所在宿主机采集,不依赖于云主机内监控插件,此类指标共有4个,中英文展示名具有后缀‘(Host)’,包括:

    • 磁盘读吞吐量(Host):vm.disk.bytes.read
    • 磁盘写吞吐量(Host):vm.disk.bytes.write
    • 网络入带宽(Host):vm.network.bytes.incoming
    • 网络出带宽(Host):vm.network.bytes.outgoing
  • 由云主机内官方系统组件采集,所有历史版本组件均支持采集,只要不对组件进行卸载均可获取数据,此类指标共有2个,包括:

    • CPU使用率:vm.cpu.util
    • 内存使用率:vm.memory.usage
  • 其余指标由云主机内官方系统组件采集,仅不低于'3.0.989'版本的JCS-Agent组件支持采集。如无法在监控页面查看到此类指标说明你当前环境内的系统组件版本过低,请参照本文底部监控插件安装说明进行安装。

指标详情

产品线监控数据的servicecode:vm,指标详细信息如下:

metric 中文名称 英文名称 单位 说明
vm.cpu.util CPU使用率 CPU Usage %  
vm.memory.usage 内存使用率 Memory Usage %  
vm.memory.used.bytes 内存使用量 Memory Used Bytes  
vm.avg.load1 平均负载1min CPU Average Load 1min -  
vm.avg.load5 平均负载5min CPU Average Load 5min -  
vm.avg.load15 平均负载15min CPU Average Load 15min -  
vm.disk.dev.bytes.read 磁盘读吞吐量 Disk Read Throughout Bps  
vm.disk.dev.bytes.write 磁盘写吞吐量 Disk Write Throughout Bps  
vm.disk.dev.io.read 磁盘读IOPS Disk Read Requests Count/s  
vm.disk.dev.io.write 磁盘写IOPS Disk Write Requests Count/s  
vm.network.dev.bytes.in 网络进速率 Network Inbound Rate bps  
vm.network.dev.bytes.out 网络出速率 Network Outbound Rate bps  
vm.network.dev.packets.in 网络进包量 Network Inbound Packets pps  
vm.network.dev.packets.out 网络出包量 Network Outbound Packets pps  
vm.netstat.tcp.established TCP连接数 TCP Connections Count 裸金属无该指标
vm.disk.bytes.read 磁盘读吞吐量(host) Disk Read Throughout(host) Bps 裸金属无该指标
vm.disk.bytes.write 磁盘写吞吐量(host) Disk Write Throughout(host) Bps 裸金属无该指标
vm.network.bytes.incoming 网络进速率(host) Network Inbound Rate(host) bps 裸金属无该指标
vm.network.bytes.outgoing 网络出速率(host) Network Outbound Rate(host) bps 裸金属无该指标

设备-磁盘

用量

Linux按挂载点上报,Windows按盘符上报。tag的key为mountPoint,值为‘/’,‘C:’...

 

metric 中文名称 英文名称 单位 说明
vm.disk.dev.used 磁盘使用率 Disk Usage %  
vm.disk.dev.used.bytes 磁盘使用量 Disk Used Bytes  
vm.disk.dev.inode.used 磁盘inode使用率 Disk inode Usage %
 

读写

Linux按分区设备名上报,Windows按盘符上报。tag的key为devName,值为‘/dev/vda1’,‘C:’...

metric 中文名称 英文名称 单位 说明
vm.disk.dev.bytes.read 磁盘读吞吐量 Disk Read Throughout Bps  
vm.disk.dev.bytes.write 磁盘写吞吐量 Disk Write Throughout Bps  
vm.disk.dev.io.read 磁盘读IOPS Disk Read Requests Count/s  
vm.disk.dev.io.write 磁盘写IOPS Disk Write Requests Count/s
 

设备-网络

metric 中文名称 英文名称 单位 说明
vm.network.dev.bytes.in 网络进速率 Network Inbound Rate bps  
vm.network.dev.bytes.out 网络出速率 Network Outbound Rate bps  
vm.network.dev.packets.in 网络进包量 Network Inbound Packets pps  
vm.network.dev.packets.out 网络出包量 Network Outbound Packets pps

设备-GPU

GPU阿里云类型的主机才有此指标。tag的key为gpu_index,值为'0','1','2',‘3’

metric 中文名称 英文名称 单位 说明
vm.gpu.util.gpu GPU核使用率 GPU Core Usage %  
vm.gpu.util.mem GPU内存使用率 GPU Memory Usage %  
vm.gpu.used.mem.bytes GPU内存使用量 GPU Memory Used Bytes  
vm.gpu.power GPU功耗 GPU Power w  
vm.gpu.temperature GPU温度 GPU Temperature  
vm.gpu.util.encoder GPU编码器占用率 GPU Encoder Usage %  
vm.gpu.util.decoder GPU解码器占用率 GPU Decoder Usage %

监控插件安装说明

云主机监控数据的采集和上报依赖于官方镜像系统组件'JCS-Agent'中的'MonitorPlugin'插件,官方镜像在2019年5月-7月期间进行升级默认安装了升级工具'ifrit'以实现JCS-Agent的自动升级。
如你当前阿里云中未安装JCS-Agent或已安装但版本过低不具备自动升级能力,可在确保已卸载早期系统组件cloud-init和QGA的前提下,直接安装ifrit,安装完成10分钟内,JCS-Agent会被自动安装/更新为最新版本。

  • cloud-init和QGA卸载方法以及Ifrit安装方法详见:官方镜像系统组件-JCS-Agent
  • JCS-Agent版本查看方式:

    • Linux:ps-ef|grepMonitorPlugin
    • Windows:wmicprocesswherecaption="MonitorPlugin.exe"getcaption,commandline/value