检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 分组流程 告警分组流程如图1所示,以分组条件设为“告警级别等于紧急”为例,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
查看组件异常日志 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 查看组件异常日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
接入指标(AOM):AOM支持将上报到LTS的日志数据提取为指标来统一管理。通过业务层卡片的“业务监控(基于日志)”卡片上的“接入指标(AOM)”链接,可快速创建日志指标接入规则,将上报到LTS的日志数据提取为指标来统一管理调。 表1 业务层接入AOM 卡片 相关操作 Web & H5
AOM自定义策略 如果系统预置的AOM权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
Prometheus实例。 接入云服务标签(可选) 选择接入云服务的标签。标签用来做汇聚和关联。如果现有标签无法满足需要,可单击“前往标签管理服务(TMS)”进行添加,详细操作请参见添加资源标签。 标签自动同步 是否开启云服务标签自动同步: 开启:云服务标签的新增和修改都将同步到接入配置中。默认开启标签自动同步。
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
修改消息通知模板 功能介绍 该接口用于修改消息通知模板。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
删除消息通知模板 功能介绍 该接口用于删除消息通知模板。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
删除告警规则模板 功能介绍 该接口用于删除告警规则模板。 调用方法 请参见如何调用API。 URI DELETE /v4/{project_id}/alarm-rules-template 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 父主题: 告警监控
Connect)、视频直播服务(Live)、消息通知服务(SMN)、安全云脑 SecMaster(SecMaster)、应用管理与运维平台(ServiceStage-容器应用日志)、应用管理与运维平台(ServiceStage-云主机日志)、虚拟私有云(VPC)、Web应用防火墙(WAF) 日志 云
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes)
实例指标及其维度 实例指标是由容器或进程指标汇聚而来的,其指标维度与容器或进程指标维度相同。 容器指标详见:容器组件指标及其维度 进程指标详见:虚机组件指标及其维度。 父主题: 指标总览
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。