检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择监控对象时,如果开启了应用到所有开关,将会针对应用或服务下的所有该类型指标创建一条告警规则。例如选择了“CCE / 主机 / 主机 / CPU使用率”指标,开启应用到所有开关,则会为CCE服务下所有主机创建一条告警规则。 单击“修改资源对象”可修改已选择的资源对象。
产品功能 应用监控 应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。
告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。
实例指标及其维度 实例指标是由容器或进程指标汇聚而来的,其指标维度与容器或进程指标维度相同。 容器指标详见:容器组件指标及其维度 进程指标详见:虚机组件指标及其维度。 父主题: 指标总览
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框
应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。
(推荐)POST方法查询瞬时数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language) 在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query
(推荐)POST方法查询区间数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query_range
应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的指标或者计算相对复杂的指标进行提前计算;尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高指标查询性能,解决用户配置以及查询慢的问题。
仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表
规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件详情页。 查看事件详情 单击事件名称可查看事件详情和修复建议。 查看已清除告警 在右上角单击“活动告警”,在下拉列表中选择“历史告警”,可查看被清除的告警。 父主题: 告警监控
计费模式概述 AOM支持按需计费方式。按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
创建AOM告警静默规则 告警静默规则功能可以在指定时间段屏蔽告警通知。 约束与限制 您最多可创建100条静默规则,如果静默规则数量已达上限100时,请删除不需要的静默规则。 静默规则一旦创建完成,即刻生效。 创建告警静默规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。
可观测指标浏览 指标浏览展示了各资源的指标数据,您可实时观测监控的指标值及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看及分析业务数据。 监控指标 登录AOM 2.0控制台。 在左侧导航栏中选择“指标浏览”。 从下拉列表选择需要监控的Prometheus实例。 通过“全量指标
创建AOM告警分组规则 告警分组规则功能可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 约束与限制 您最多可创建100条分组规则,如果分组规则数量已达上限100时,请删除不需要的分组规则。 当前仅华南-广州区域“告警管理
GET方法获取标签名列表 功能介绍 该接口使用GET方法获取标签名列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:event2AlarmRule