检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
Agent包下载配置 表1 Agent包下载配置 区域 Agent包下载地址 SHA-256 华北-北京一 https://icagent-cn-north-1.obs.cn-north-1.myhuaweicloud.com/ICAgent_linux/ICProbeAgent
查询事件告警信息 功能介绍 该接口用于查询对应用户的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取
获取告警发送结果 功能介绍 该接口用于获取告警发送结果。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alarm-notified-histories 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询时序数据 功能介绍 该接口用于查询指定时间范围内的监控时序数据,可以通过参数指定需要查询的数据维度,数据周期等。(该接口已不再演进,建议使用 (推荐)POST方法查询区间数据接口。) 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/samples
新增消息通知模板 功能介绍 该接口用于新增消息通知模板。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
通过IAM授予使用AOM的权限 创建用户并授权使用AOM AOM自定义策略
配置AOM菜单开关 AOM支持用户自定义选择在控制台导航栏中显示或隐藏“概览”、“应用洞察”、“自动化运维”、“云服务监控”、“业务监控”等功能。 配置AOM菜单开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“菜单开关”,所有
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
虚机组件指标及其维度 AOM中,虚机组件指的是进程,虚机组件指标指的就是进程指标。 表1 进程指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU
新增告警行动规则 功能介绍 新增告警行动规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制
查询Prometheus实例 功能介绍 该接口用于查询Prometheus实例。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
修改告警行动规则 功能介绍 修改告警行动规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:ev
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
查询系统中已有服务发现规则 功能介绍 该接口用于查询系统当前已存在的服务发现规则。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id
删除策略 功能说明 该接口用于删除指定策略。 URI DELETE /v1/{project_id}/pe/policy 请求消息 请求消息头 请求消息头如表1所示。 表1 请求消息头 参数 描述 是否为必选 示例 Deployment-Name 应用名 必选 - Policy-Id
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规