检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。指标分为系统指标和自定义指标。 系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。
基础设施监控:支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。 日志管理:提供全场景日志采集、百亿日志秒搜、PB级存储、一站式日志加工、日
d_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_container_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_c
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管
该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_node_cpu_usage cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) 内存 aom_node_memory_total_megabytes totalMem 物理内存容量
s) 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件 用户已被授予“AOMFullAccessPolicy
件)的日志文件。 AOM能监控其他云服务商的服务器吗? 可以,您需要先购买一台华为云创建弹性云服务ECS作为跳板机用于监控数据的转发,同时需要在其他云服务商的服务器上安装ICAgent。详细的操作步骤参考安装ICAgent(非华为云主机)。 采集器ICAgent对资源的占用大吗?例如内存、CPU。
ed_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(aom_process_handle_count)
个/秒(Packet/s) NPU ma_container_npu_util NPU使用率 该指标用于统计测量对象的NPU使用率。 0~100 百分比(%) ma_container_npu_memory_util NPU显存使用率 该指标用于统计测量对象已使用的NPU显存占NPU存储容量的百分比。
单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 通过ECS控制台提供的远程登录方式登录ECS。 登录ECS控制台,在“弹性云服务器”界面的列表中单击ECS所在行“操作”列的“远程登录”,根据界面提示以root用户登录ECS。 图1 远程登录ECS
Write地址的能力,支持将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 配置自建Prometheus数据上报到AOM
的操作。 图2 查看线程分析信息 表1 线程分析参数说明 参数名称 说明 线程名称 线程具体名称。 线程ID 线程的ID。 CPU使用率 CPU使用率。 状态 线程状态,包括:NEW、BLOCKED、WAITING、TIMED_WAITING、TERMINATED以及RUNNABLE。
指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等 主机网络 接收Bps、接收错包率、发送错包率、总Bps。 主机磁盘、文件系统 磁盘读取速率、磁盘写入速率、磁盘使用率。 主机指标 CPU内核总量、物理内存使用率、主机状态、NTP偏移量。 应用性能指标 请求平均时延、错误调用次数、请求吞吐量。
ometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。 创建Prometheus 通用实例
ICAgent版本说明 表1 ICAgent版本说明 版本号 说明 5.12.135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。
(RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务IAM为您创建名为“ aom_admin_trust
F) 指标 通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。详细操作请参见:云服务指标接入AOM。 应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(CBH)、云容器引擎(CCE)、
本章主要介绍通过部署Prometheus将AccessCode配置到Prometheus的配置文件并使之生效。 前提条件 已购买弹性云服务器ECS。 操作步骤 安装并启动Prometheus,具体操作请参见Prometheus官方文档。 添加AccessCode。 登录AOM控制台,在左侧导航栏中选择“配置管理
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? UniAgent和ICAgent安装类常见问题 如何在VPCEP控制台为AOM/LTS创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? ECS主机上执行UniAgent安装命令,下载安装脚本失败