检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
ty}_${event_type}_${clear_type}]于${starts_at}时间发生告警\",\"content\":\"华为云账号:${domain_name};\\n通知类型:${event_type};\\n事件级别:${event_severity};\\n
AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统(AO
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_cluster_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核数。 ≥0 核(Core) CPU使用率(aom_cluster_cpu_usage) 该指标用于统计测量对象的CPU使用率。
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) aom_node_cpu_used_core CPU内核占用 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_node_cpu_usage CPU使用率 该指标用于统计测量对象的CPU使用率。
CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_process_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage)
持各种数据采集插件生命周期管理能力。 统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_node_cpu_usage) 该指标用于统计测量对象的CPU使用率。
UniAgent版本 UniAgent的版本,必选项。 1.1.6 接入方式 接入UniAgent的方式,此处选择“直连接入”。 直连接入:华为云主机,使用直连接入的方式。 直连接入 安装命令 安装UniAgent的命令,此处选择复制LINUX安装命令。 单击复制安装命令。 set +o
线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
String 所属project ID。 version String UniAgent版本。 is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 在事件列表中,有以下关键功能: 事件列表:支持按事件级别图形化查看告警信息。 高级过滤:支持在搜索框中按事件级别
障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果抑制规则数量已达上限100时,请删除不需要的抑制规则。 创建告警抑制规则