什么是阿里云云监控
阿里云云监控是阿里云为金融用户提供的监控服务,您可以通过阿里云云监控实时查看您的云服务器、云磁盘、数据库等云资源的性能指标、监控视图和告警记录,还可以对重要资源自定义配置及告警信息,实时掌握资源使用情况,保证应用稳定运行。
阿里云云监控主要应用于企业用户中少量人运维大量云服务的场景。阿里云云监控服务配置告警时,您可以为每一类服务配置一个或多个模板,将模板关联到具体的监控对象服务实例上。当需要调整告警策略时,可以通过修改模板中的告警规则来完成。阿里云云监控可以将告警以邮件、电话和短信方式通知到指定的联系人组。同时,阿里云云监控可以对监控对象的性能指标、历史趋势和告警报表进行可视化呈现。
监控大盘
用户可以根据业务监控需求,将多个实例的监控项配置在一个监控大盘上,便于运维人员实时掌控业务运行状态。
大盘分组
用户可以对自定义的监控大盘进行分组,一个分组下可以有多个监控大盘。
监控对象
监控对象是阿里云云监控进行监控和收集性能指标的对象,分为主机、应用、网络、存储、容器类。
监控图表
一个监控大盘是由多个监控图表组成。监控图表可以按监控项及实例两个视角显示。
按监控项视角:即每个图表是一个监控项,您可以在同一个图表中查看多个实例关于该监控项的数据变化趋势。例如,某个应用部署了多台ECS实例,需要对ECS实例的CPU使用率进行监控,您可以选择按监控项视角来添加一个监控图表,这样就可以在一张图表中同时展示多个ECS实例各自的CPU使用率随时间的变化趋势。
按实例角度:即每个图表是一个实例,您可以在同一个图表中查看同一个实例的不同监控项的数据变化趋势。例如,您可以需要监控某个ECS实例的CPU使用率、内存使用率及磁盘使用率等指标,可以按实例角度添加监控图表,这样就可以在一个图表中同时查看该实例针对这三个监控项的监控数据变化趋势。
监控项
用户设置的或者系统默认的采集的监控指标,例如 CPU使用率、内存使用率、磁盘负载等。
Tag标签
Tag可以对监控项进行补充说明。例如, df.bytes.used(磁盘使用量)需要携带两个Tag:
mount:挂载点
fstype:文件系统类型
告警级别
定义告警的严重程度,告警级别由高到低分为P1~P6,共六个级别。
P1:致命
P2:较致命
P3:严重
P4:较严重
P5:警告
P6:提示
告警策略/规则
对一个告警条件的描述。例如,CPU 使用率连续 5 分钟大于 90% 告警,最大告警次数为 3 次,告警级别为 P3。
告警模板
针对某一类监控对象所设置的告警规则及联系人组信息。用户一般会可根据自己的业务模块给相应的服务类型配置一个或多个告警模板。
报警联系人
报警通知接收的人员及其联系方式。例如,需要配置人员姓名、手机、邮箱等信息。
报警联系人组
多个报警联系人的集合,可以是某个业务的全部相关负责人。