检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes)
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
参考信息 Agent包下载配置
升级AOM 手动升级 一键迁移
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
基本概念 应用资源管理 资源监控 自动化运维 采集管理
集群指标 clusterId 集群ID。 clusterName 集群名称。 projectId 项目ID。 容器指标 appID 服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName
日志 查询日志 父主题: API
应用示例 查询时间序列 查询时序数据 查询指定告警行动规则详细信息
告警 查询事件类告警规则列表 新增一条事件类告警规则 更新事件类告警规则 删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件或告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过告警规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则
弹性伸缩(即将下线) 创建策略 删除策略 更新策略 查看策略列表 查看单个策略 更新策略组属性 查询策略组属性 父主题: 历史API
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
Prometheus实例 卸载托管Prometheus实例 查询Prometheus实例 新增Prometheus实例 创建Prometheus实例的预聚合规则 获取Prometheus实例调用凭证 修改Prometheus实例 父主题: API
应用资源管理(aom2.0接口) 新增应用 删除应用 查询应用详情 修改应用 新增组件 删除组件 查询组件详情 修改组件 创建环境 删除环境 查询环境详情 修改环境 查询绑定在节点上的资源列表 根据应用名称查询应用详情 根据环境名称查询环境详情 根据组件名称查询组件详情 新增子应用
应用管理 应用管理的使用说明 创建应用 添加节点 添加环境 关联资源 父主题: 应用资源管理
自动化运维权限管理 创建用户并授权使用自动化运维 自动化运维自定义策略 父主题: 运维管理
运维配置 管理OS账号 管理访问凭证 查看场景分类 父主题: 运维管理
配置AOM告警通知 创建AOM告警消息模板 创建CES通知对象和通知组 创建AOM告警行动规则(告警通知规则) 父主题: 告警监控