检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus实例 “√”表示支持,“x”表示暂不支持。 表1 Prometheus实例 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 卸载托管Prometheus实例 DELETE /v1/{project_id}/aom/prometheus
公共响应消息头 响应的消息报头在大多数情况下含有下面报头: 表1 响应消息头 名称 描述 示例 Date HTTP协议标准报头。表示消息发送的时间,时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题:
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:ev
UniAgent管理 “√”表示支持,“x”表示暂不支持。 表1 UniAgent管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 下发批量安装UniAgent任务 POST /v1/{project_id}/un
“√”表示支持,“x”表示暂不支持。 表1 prometheus监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1/query_range aom:metric:list
通过控制台获取账号ID和项目ID 在调用接口时,部分URI中需要填入用户名称、用户ID、项目名称、项目ID,在“我的凭证”页面可以获取这些信息。 登录控制台。 单击右上角已登录的用户名,在下拉列表中单击“我的凭证”。 在“API凭证”界面,可以查看用户名称、账号ID、项目名称、项目ID。 调用API获取项目ID
应用监控 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。通过应用监控您可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 功能介绍 应用监控基于应用资源管理对资源实行从应用、业务组件、到环境的分层监控,每一层对应的观测指标均不同。 应用层监控
应用资源管理 “√”表示支持,“x”表示暂不支持。 表1 应用资源管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增应用 POST /v1/applications aom:cmdbApplication:create
自动化运维 “√”表示支持,“x”表示暂不支持。 表1 自动化运维 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 创建任务 POST /v1/{project_id}/cms/workflow cms:workflow:create
通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。 获取指定告警行动规则的详细信息 接口相关信息 URI格式:GET /v2/{project_id}/alert/ac
执行以下命令,检查ICAgent是否可成功上报指标。 cat /var/ICAgent/oss.icAgent.trace | grep httpsend | grep MONITOR 若回显信息中包含“failed”字样,则说明ICAgent无法成功上报指标 => 执行3 若回显信息中无“failed”字样,则说明ICAgent可成功上报指标
致的资源配置数据。 采集管理 统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放 支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
组件等资源使用情况。 前提条件 已创建告警行动规则。 步骤一:创建分组规则 创建一个分组规则,当产生AOM的紧急、重要告警时,触发“Monitor_host”行动规则,且告警按照告警源合并分组。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警降噪”。 在“分组规则”页签下单击
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
应用资源管理 表1 应用资源管理基本概念 术语 说明 应用资源管理 简称CMDB,在AOM2.0中管理应用与云资源的关系,并为AOM的监控、自动化运维、APM服务提供统一、及时的资源环境管理服务。 应用TOPO结构 资源与应用关系的层次结构。CMDB遵循“应用 + 子应用(可选)+
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。