检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看AOM告警或事件 “告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
理员了解标签策略详情。 - 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。本示例可不填写。 详细说明请参见标签和标注。 - 设置告警通知策略。具体参数说明请参见表6。 图4 设置告警通知策略 表6 告警通知策略填写说明
场景。本示例可不填写。 - 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。本示例可不填写。 - 设置告警通知策略。具体参数说明请参见表4。 图7 告警通知 表4 告警通知策略填写说明 参数名称 参数说明 示例
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
操作 说明 仪表盘 另存为 保存仪表盘后,通过页面右侧的“更多”下拉列表框,可另存、重命名或删除仪表盘。 重命名 删除 导出监控报告 单击“导出监控报告”,可将仪表盘中的曲线图以CSV格式导出,以便进行本地存储及进一步分析。 设置全屏模式在线时长 选择待操作的仪表盘,在“仪表盘”页面右上角单击。
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes)
阈值告警最佳实践(旧版) 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。
理员了解标签策略详情。 - 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。本示例可不填写。 详细说明请参见标签和标注。 - 设置告警通知策略。具体参数说明请参见表8。 图3 设置告警通知策略 表8 告警通知策略填写说明
企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能监控资源
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
概述 本功能当前在华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,
查询系统中已有服务发现规则 功能介绍 该接口用于查询系统当前已存在的服务发现规则。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询事件告警信息 功能介绍 该接口用于查询对应用户的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取
PM类型与default类型Prometheus实例支持。 仪表盘 AOM支持在Prometheus实例的“仪表盘”中通过系统预置的仪表盘模板快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 当前仅云服务类
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。