检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接入AOM总览 AOM作为华为云服务可观测性分析统一入口,通过新版接入中心可以快速接入AOM指标、LTS日志和APM调用链,接入完成后,即可方便地在“指标浏览”、“日志管理”、“应用监控”等页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的LTS日志、APM调用链等信息。
云服务接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将云服务相关指标接入AOM、将云服务相关日志接入LTS以及查看云服务日志接入LTS相关操作文档。 前提条件 已接入通用实例类型Prometheus监控,详情请参见创建Prometheus 通用实例。
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring/coredns/0
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请
如何获取Prometheus实例的服务地址? 用户可以登录AOM控制台,进入Prometheus实例的详情页面,获取Prometheus实例的服务地址。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
获取工作流执行中的执行详情 功能介绍 该接口可获取任务的执行详情,可指定工作流ID和执行ID去查询对应的任务,返回任务执行详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/cms/workflow/{workflow_id}/execut
基础指标:虚机指标 介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM
(推荐)POST方法获取标签名列表 功能介绍 该接口使用POST方法获取标签名列表。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
查询时间序列 功能介绍 该接口用于查询系统当前可监控的时间序列列表,可以指定时间序列命名空间、名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/series
查询监控数据 功能介绍 该接口用于查询指定时间范围内指标的监控数据,可以通过参数指定需要查询的数据维度,数据周期等。(该接口已不再演进,建议使用 (推荐)POST方法查询区间数据接口。) 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metricdata
获取静默规则列表 功能介绍 获取静默规则列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取
修改消息通知模板 功能介绍 该接口用于修改消息通知模板。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String