阿里云弹性伸缩监控告警指标介绍

弹性伸缩监控指标:

CPU使用率;内存使用率;磁盘使用率;外网入带宽;外网出带宽

每个指标可以支持以下维度:

最大值;最小值;平均值

指标聚合方法

阿里云弹性伸缩是对阿里云服务器集群进行监控,这会涉及到多个阿里云服务器,以及这些阿里云服务器在时间周期内产生的多个监控数据,这些数据会先进行聚合,再根据用户配置策略进行操作。

统计的基本策略是每个周期对每台云服务器的设定监控项进行1分钟取值(每分钟取一个值),若取到的值连续多个周期都符合设定的规则(周期数用户可自定义),则会触发告警伸缩行为。

例如:某伸缩组中有5台阿里云服务器实例,定义的告警伸缩策略是“CPU利用率在 5 分钟内的最大/最小/平均值大于 50%,发生3次”,弹性伸缩采集监控数据和策略判断,步骤如下:

步骤一:系统会每分钟对每台阿里云服务器取 1个值,一个周期(当前设置为 5分钟)里取了 25 个 CPU 使用率的值;

步骤二:根据配置是最大值 / 最小值 / 平均值结合策略进行判断是否符合告警规则。

最大值:如果这 25 个值中的最大值有超过阈值(50%)的,该周期符合告警伸缩规则。

最小值:如果这 25 个值中的最小值有超过阈值(50%)的,该周期符合告警伸缩规则。

平均值:如果这 25 个值的平均值有超过阈值(50%)的,该周期符合告警伸缩规则。

步骤三:如果连续 3 个周期(共 15 分钟,每 5 分钟判断当前周期)都符合此规则,则会触发伸缩行为。