远程云监控系统相关概念

监控指标

监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一系列监控数据,帮助用户了解特定时间内该监控指标的变化。

聚合

聚合是云监控服务在特定周期内对各服务上报的原始采样数据采取平均值、最大值、最小值、求和值、方差值计算的过程。这个计算的周期又叫做聚合周期,目前云监控服务支持5分钟、20分钟、1小时、4小时、24小时共五种聚合周期。

监控面板

监控面板为用户提供自定义查看监控数据的功能,支持在一个监控面板跨服务、跨维度查看监控数据,将您关注的重点服务监控指标集中呈现,既能满足总览服务运行概况,又能满足排查故障时快速查看监控详情的需求。

主题

主题是消息通知服务中消息发布或客户端订阅通知的特定事件类型,为用户提供一对多的发布订阅以及消息通知功能,支持用户实现一站式多种消息通知方式。借助消息通知服务,云监控服务在监控到云服务资源发生变化时,通过多种方式通知用户,让用户实时掌握云服务的运行状况。

告警模板

告警模板是一组以服务为单位的告警规则组合,它可以帮助用户快速为多个云服务创建告警规则,极大的提高了维护人员的工作效率。

告警规则

告警规则是指用户对云服务的某个监控指标设置阈值,当告警规则的状态(告警、恢复正常)变化时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,避免因资源问题造成业务损失。

项目

项目用于将OpenStack的资源(计算资源、存储资源和网络资源)进行分组和隔离。项目可以是一个部门或者一个项目组。一个帐户中可以创建多个项目。

企业项目

企业可以根据组织架构规划企业项目,将企业分布在不同区域的资源按照企业项目进行统一管理,同时可以为每个企业项目设置拥有不同权限的用户组。

云监控服务支持企业项目,只有拥有对应企业项目权限的用户才有权限查看和管理资源分组、告警规则和监控面板。

监控云平台应用场景

云监控服务为用户提供了非常丰富的使用场景

  • 云服务监控

    用户开通了云监控服务支持的云服务后,即可方便地在云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。

  • 主机监控

    主机监控分为基础监控、操作系统监控和进程监控。

  • 处理异常场景

    云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。

  • 事件监控

    事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。

  • 扩容场景

    对CPU使用率、内存使用率、磁盘使用率等监控项创建告警规则后,可以让您方便的了解云服务现状,在业务量变大后及时收到告警通知进行手动扩容,或配合弹性伸缩服务自动伸缩。

  • 站点监控

    站点监控服务目前提供HTTP(HTTPS)、TCP、UDP、PING 4种探测协议,可探测您站点的可用性、响应时间、丢包率等,让您全面了解站点的可用性并在异常时及时处理。

  • 自定义监控

    自定义监控补充了云服务监控的不足,当云监控服务未能提供您需要的监控项,那么您可以创建自定义监控项并采集监控数据上报到云监控服务,云监控服务会对自定义监控项提供监控图表展示和告警功能。

监控云平台使用事件监控

事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。

事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。

事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明

事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。上报自定义事件请参见上报事件

自定义事件监控与自定义监控的区别:

  1. 自定义事件监控用于解决非连续的事件类型监控数据上报、查询与告警的场景。
  2. 自定义监控用于解决周期性、连续采集的监控数据上报、查询与告警的场景。

创建告警规则

1、登录管理控制台。

2、单击“服务列表 > 云监控服务”。

3、单击左侧导航栏的“事件监控”,进入“事件监控”页面。

4、在事件列表页面,单击相应事件所在行的创建告警规则,进入创建告警规则页面。

5、根据界面提示,配置告警规则名称、告警策略、告警通知等。

告警规则创建完成后,当事件监控指标触发设定的告警策略时,云监控服务会在第一时间通过消息通知服务告知您云上资源异常,以免因此造成业务损失。

查看事件监控图表

1、登录管理控制台。

2、单击“服务列表 > 云监控服务”。

3、单击左侧导航栏的“事件监控”,进入“事件监控”页面。

4、在“事件监控”页面,默认展示近24小时的所有系统事件与自定义事件。

5、单击具体事件右侧的操作列的“查看监控图表”,可查看具体事件的监控图表。

监控云平台视频教程

云监控 Cloud Eye介绍

02:51

云监控 Cloud Eye介绍

使用主机监控

04:19

使用主机监控

使用站点监控

03:54

使用站点监控