检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
更新策略组属性 功能说明 该接口用于更新策略组属性。 URI PUT /v1/{project_id}/pe/policy/config 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID 请求消息 请求消息头 请求消息头如表2所示。
修改阈值规则 功能介绍 该接口用于修改一条阈值规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也
Redis Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
ElasticSearch Exporter接入AOM实现指标监控 应用场景 使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Elasti
删除阈值规则 功能介绍 该接口用于删除阈值规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alarm-rules/{alarm_rule_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
批量删除阈值规则 功能介绍 该接口用于批量删除阈值规则 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/alarm-rules/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
Kafka Exporter接入AOM实现指标监控 应用场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
查询仪表盘列表 功能介绍 该接口用于查询仪表盘列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/aom/dashboards 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获
设置日志配额 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”。 在“配额设置”页签下可以查看您当前使用日志大小、存储时长。 如果在AOM中已创建日志接入LTS规则,则实际的日志存储时长以LTS中“日志管理”界面设置的“日志存储时间(天)”为准,“配置设置”界面的“日志存储时长”不生效。
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
查看组件调用链监控项 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。本章节主要介绍如何查看某个组件的调用链情况。 查看组件调用链 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“
下发批量安装UniAgent任务 功能介绍 该接口用于下发批量安装UniAgent任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/uniagent-console/mainview/batch-import 表1 路径参数 参数 是否必选
查询时间序列 功能介绍 该接口用于查询系统当前可监控的时间序列列表,可以指定时间序列命名空间、名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/series