检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指
修改Prometheus实例 功能介绍 该接口用于修改Prometheus实例。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题:
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
新增消息通知模板 功能介绍 该接口用于新增消息通知模板。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
配置AOM菜单开关 AOM支持用户自定义选择在控制台导航栏中显示或隐藏“概览”、“应用洞察”、“自动化运维”、“云服务监控”、“业务监控”等功能。 配置AOM菜单开关 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“菜单开关”,所有
日志费用说明 初次使用AOM时,默认为您开通基础版套餐包,该版本包含免费额度,如日志读写流量免费额度为500MB,超过额度的部分将自动按需收费。 AOM中日志相关功能由云日志服务LTS提供,并由LTS统一上报日志、话单,AOM不重复计费。如需停止计费请参见:如何停止日志功能,不再收费?
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
授权AOM访问其他云服务 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。
删除策略 功能说明 该接口用于删除指定策略。 URI DELETE /v1/{project_id}/pe/policy 请求消息 请求消息头 请求消息头如表1所示。 表1 请求消息头 参数 描述 是否为必选 示例 Deployment-Name 应用名 必选 - Policy-Id
通过AOM监控工作负载 工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
虚机组件指标及其维度 AOM中,虚机组件指的是进程,虚机组件指标指的就是进程指标。 表1 进程指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:ev