检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
否存在异常,全面掌握集群的实时运行状况。本章节以监控云容器引擎 CCE的CPU使用率指标“aom_container_cpu_usage”,当该指标达到告警阈值条件时,产生告警为例,帮助您快速上手使用应用运维管理。 操作流程 开通AOM 2.0并授权。 容器监控:在云容器引擎 C
作详见订阅主题。 例如,订阅者设置为该运维人员的邮箱。 创建通知规则:输入规则名称,选择通知条件,选择2中已创建的主题,根据实际选择时区/语言,输入通知消息后,单击“确定”。如图1所示。 图1 创建通知规则 通知规则创建成功后,满足通知规则时,该运维人员均会收到相关的邮件或短信通知信息。
HAProxy指标接入AOM 您可以直接使用AOM提供的HAProxy Exporter插件给主机创建采集任务,并安装HAProxy Exporter插件,就可以监控HAProxy相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
HAProxy指标接入AOM 您可以直接使用AOM提供的HAProxy Exporter插件给主机创建采集任务,并安装HAProxy Exporter插件,就可以监控HAProxy相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
GET方法查询瞬时数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query 表1 路径参数
MongoDB指标接入AOM 您可以直接使用AOM提供的MongoDB Exporter插件给主机创建采集任务,并安装MongoDB Exporter插件,就可以监控MongoDB相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
error_msg String 错误信息描述。 error_type String 错误类型。 trace_id String 跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例
GET方法获取标签名列表 功能介绍 该接口使用GET方法获取标签名列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
(推荐)POST方法获取标签名列表 功能介绍 该接口使用POST方法获取标签名列表。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
MongoDB指标接入AOM 您可以直接使用AOM提供的MongoDB Exporter插件给主机创建采集任务,并安装MongoDB Exporter插件,就可以监控MongoDB相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
文件系统的各种指标。 单击“告警分析”页签,在列表中可查看该主机的相关告警信息。 单击“磁盘分区”页签,在列表中可查看磁盘分区类型、大小和使用率情况。 当前磁盘分区功能支持的系统为:CentOS 7.x版本、EulerOS 2.5。 父主题: 资源监控
单击添加告警标签。告警标签为告警标识性属性,key:value键值对格式,主要应用于告警降噪等场景。本示例可不填写。 - 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。本示例可不填写。 - 设置告警通知策略。具体参数说明请参见表4。
计费模式概述 AOM支持按需计费方式。按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
error_msg String 错误信息描述。 error_type String 错误类型。 trace_id String 跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例
(推荐)POST方法查询瞬时数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language) 在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query
(推荐)POST方法查询区间数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query_range
足全部条件触发”的计算方式时,不支持使用无数据处理功能。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。 告警标签 单击添加告警标签。告警标签为告警标识性属性,key:value键值对格式,主要应用于告警降噪等场景。详细说明请参见标签和标注。
aom_node_gpu_memory_usage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_node_gpu_memory_used_megabytes 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage
查询UniAgent主机列表信息 功能介绍 该接口用于查询执行过安装UniAgent任务的主机列表信息。该接口对租户不开放,仅支持白名单服务COC使用。如其他服务有需求,可通过提交工单,申请开放此接口。 调用方法 请参见如何调用API。 URI POST /v1/uniagent-console/agent-list/all