检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
监控总览 监控概览 仪表盘
告警管理 告警管理使用说明 告警规则(旧版) 告警规则(新版) 创建通知规则 查看告警 查看事件 告警行动规则 告警降噪
告警管理 告警管理使用说明 告警规则 告警模板 查看告警 查看事件 告警行动规则 告警降噪
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"metadata"字段
资源监控 资源监控使用说明 应用监控 组件监控 主机监控 容器监控 指标浏览 云服务监控
权限管理 创建用户并授权使用AOM AOM自定义策略 云服务授权
权限管理 创建用户并授权使用AOM AOM自定义策略
编写JSON格式的策略内容。 具体创建步骤请参见:创建自定义策略。本章为您介绍常用的自动化运维自定义策略样例。 自动化运维自定义策略样例 示例:拒绝用户对服务卡片进行上下架操作 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在A
指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
用于并行发送到远程存储的队列中每个分片的容量 prometheus_remote_storage_shards 当前用于并行发送到远程存储的分片数 prometheus_remote_storage_shards_desired 分片队列期望基于输入样本和输出样本的比率运行的分片数 p
升级AOM 手动升级 一键迁移
UniAgent 安装与配置 安装UniAgent 安装UniAgent(新版) 管理UniAgent 管理主机的ICAgent插件 父主题: 采集设置
应用管理 应用管理的使用说明 创建应用 添加节点 添加环境 关联资源 父主题: 应用资源管理
l 写入成功的字节总数 node_disk_writes_completed_total 写入完成的次数 node_disk_write_time_seconds_total 写入花费的总时长 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node
业务监控(BETA) 创建日志指标规则 创建日志指标规则(新版)
升级AOM 手动升级 一键迁移
一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。 周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。 时区/语言
ent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止
iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量 ≥0 个 iotda_device_status_abnormalCount