检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新策略 功能说明 该接口用于修改策略规则。 告警策略支持更新,定时和周期策略不支持更新。 URI PUT /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES
AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的指标或者计算相对复杂的指标进行提前计算
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则 通过指标告警规则可对资源的指标设置阈值条件
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
安装成功后,在左侧导航栏中选择“配置管理 > Agent管理”,查看该服务器ICAgent状态。 父主题: 资源接入AOM
查询策略组属性 功能说明 该接口用于查询策略组属性。 URI GET /v1/{project_id}/pe/policy/config 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID 请求消息 请求消息头 请求消息头如表2所示。
日志组(LogGroup)是云日志服务进行日志管理的基本单位,可以创建日志流以及设置日志存储时间,每个账号下可以创建100个日志组。创建日志组详细操作参见日志组。 日志流 选择日志流。
在左侧导航栏中选择“告警管理 > 告警降噪”。 在“静默规则”页签下单击 “创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1 设置静默规则 类别 参数名称 说明 - 规则名称 静默规则的名称。
在左侧导航栏中选择“告警管理 > 告警规则”。 在右侧区域选择“日志告警规则”页签,然后单击“创建日志告警规则”。 在“新建告警规则”页面,配置告警规则相关参数,具体参数说明如所示表 告警条件填写说明。
前往“接入管理”页面查看、编辑或删除配置的接入规则,详情请参见接入管理。 父主题: 接入AOM(新版)
当CCE服务的资源满足设置的事件告警条件时,在告警界面就会生成一条事件类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。同时,系统会以邮件、短信等方式发送告警通知给指定人员。 图4 创建事件告警规则 父主题: 配置AOM告警规则
获取告警行动规则列表 功能介绍 获取告警行动规则列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取
AOM 1.0与AOM 2.0使用对比 具有AOM 1.0的权限后,使用AOM 2.0需要单独授权吗? AOM 2.0采用新计费方式,与AOM 1.0的计费方式不同,所以首次从AOM 1.0切换到AOM 2.0,还需要再单独申请AOM 2.0的操作权限,具体请参见开通AOM 2.0
查看组件异常日志 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 查看组件异常日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面
通道静默 当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致: 可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明