检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
安装ICAgent(非华为云主机) 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时
安装ICAgent 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的
在预览界面,可根据需要修改消息主题。 表1 默认消息模板变量说明 变量名称 变量说明 变量定义 账号 登录管理控制台的账号。 ${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示
Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息。 412 Precondition Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于
s:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout: '["container_name0", "container_name1"]' 规则如下: 如果没有kubernetes.AOM.log.stdout:字段,默认采集该pod
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.” 可能原因 当前用户账号已欠费或者被冻结,导致没有应用资源管理的操作权限。
{Site domain name suffix}/v1/{project_id}/api/v1/read' Remote Read地址的参数说明如下: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix
容器区分IO操作对磁盘的使用总量 container_memory_failures_total 容器内存分配失败的累积计数 container_memory_failcnt 容器内存使用达到限制的次数 container_memory_cache 容器总页缓存内存 container_memory_mapped_file
public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great
public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great
trace | grep httpsend | grep MONITOR 若回显信息中包含“failed”字样,则说明ICAgent无法成功上报指标 => 执行3。 若回显信息中无“failed”字样,则说明ICAgent可成功上报指标 => 执行 4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
是否必选 参数类型 描述 install_version 否 String 指定安装的ICAgent版本。 domain_ak 否 String IAM账号AK,选填。 domain_sk 否 String IAM账号SK,选填。 响应参数 状态码: 200 表6 响应Body参数 参数
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续
错误码 错误码 错误信息 处理措施 SVCSTG.PE.4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。 SVCSTG.PE.5001205 Failed to delete records. 请联系技术支持工程师解决。
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内置的指标管理功能采集到自定义指标并上报指标到AOM。
您可通过在AOM中设置告警规则,及时了解CCE集群中各种资源是否存在异常,全面掌握集群的实时运行状况。本章节以监控云容器引擎 CCE的CPU使用率指标“aom_container_cpu_usage”,当该指标达到告警阈值条件时,产生告警为例,帮助您快速上手使用应用运维管理。 操作流程 开通AOM 2.0并授权。
≥0 千字节/秒(kB/s) aom_container_disk_write_kilobytes 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) aom_container_filesystem_available_capacity_megabytes
envoy_cluster_circuit_breakers_default_remaining_cx 连接断路器的剩余连接数 断路器达到并发限制之前的剩余连接数。 ≥0 个 envoy_cluster_circuit_breakers_high_remaining_cx envoy_cluster_circu