检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改Prometheus实例 功能介绍 该接口用于修改Prometheus实例。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题:
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
统计事件告警信息 功能介绍 该接口用于分段统计指定条件下的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/statistic 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
删除告警规则模板 功能介绍 该接口用于删除告警规则模板。 调用方法 请参见如何调用API。 URI DELETE /v4/{project_id}/alarm-rules-template 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项
批量删除阈值规则 功能介绍 该接口用于批量删除阈值规则 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alarm-rules/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
删除消息通知模板 功能介绍 该接口用于删除消息通知模板。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
删除服务发现规则 功能介绍 该接口用于删除服务发现规则。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询时间序列 功能介绍 该接口用于查询系统当前可监控的时间序列列表,可以指定时间序列命名空间、名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/series
修改消息通知模板 功能介绍 该接口用于修改消息通知模板。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
配置AOM告警规则 AOM告警规则概述 创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 创建CES告警规则 创建CES一键告警 批量创建AOM云服务告警规则 创建CES告警模板 管理AOM告警规则 标签和标注 普罗语句说明 父主题:
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 创建CES告警屏蔽规则 父主题: 告警监控
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管