阿里云高可用自动伸缩介绍
高可用开启自动伸缩后,可设置基于监控指标(如CPU、内存利用率)配置的告警策略以及预先设置时间,到预设时间后自动伸缩的定时策略来进行阿里云服务器数量的增减,以应对业务负载波动情况。对于自动伸缩你需要了解以下概念。
移除策略
当告警策略/定时策略触发移除高可用组内阿里云服务器时,会按照自动伸缩配置的移除策略决定移除哪些是里。你可从以下三种移出策略中选择:
默认策略:将按照均匀部署的原则,将移除阿里云服务器数最多的可用区内对应阿里云服务器数最多的故障域内阿里云服务器,若有多台阿里云服务器满足要求,则随机选择。
移除最早购买:移除最早购买的阿里云服务器。
移除最晚购买:移除最晚购买的阿里云服务器,即最新的阿里云服务器。
请注意,移除策略只对自动移除生效,对于自动移除而言将只移除按配置计费阿里云服务器,即若满足条件的为包年包月阿里云服务器,则按照要求继续寻找满足要求的阿里云服务器,直至满足的为按配置计费阿里云服务器。此外自动移除阿里云服务器的同时将自动删除该阿里云服务器。
冷却时间
阿里云高可用自动伸缩功能有两个冷却时间时间概念,一个是每一条告警策略所设置的冷却时间,一个是自动伸缩默认冷却时间(生效于定时伸缩策略,默认值为300s,暂不支持修改),可以确保在上一次伸缩活动真正生效前自动伸缩不会新增或移除其他阿里云服务器。手动新增或移除高可用组内阿里云服务器则不受冷却时间限制。
高可用新增阿里云服务器后,由于阿里云服务器购买以及应用自启动配置需要一段时间,完成后能分担业务负载。如果没有冷却时间,同时告警伸缩策略监控周期或重复周期配置值较小,会导致负载降低前不断出发自动新增阿里云服务器,而第一次新增的阿里云服务器接管业务后,发现负载过低,然后又会触发缩容。
例如,业务出现流量高峰,导致告警策略的警报触发。该警报触发时,高可用组自动伸缩会新增一台阿里云服务器来帮助处理增加的业务。但是存在一个问题:该阿里云服务器需要几分钟的时间才能购买完成,并且启动后需要时间配置服务并逐渐从负载均衡接收请求。在此期间,告警策略可能会继续触发,从而导致一直在新增阿里云服务器。但若你设置了冷却时间,在新增一台阿里云服务器后,高可用组自动伸缩将处于冷却中,所有自动伸缩活动将暂停,直至经过了对应的时间(假设为 300s)。这样新购买的阿里云服务器有时间开始处理应用程序流量。冷却时间过后,如果告警策略再次触发,则高可用组将自动新增一台阿里云服务器,而冷却时间也会再次生效。