检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警中心 > 一键告警”。 登录CES控制台。
管理主机的ICAgent插件 AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。
接入AOM总览 AOM作为华为云服务可观测性分析统一入口,通过新版接入中心可以快速接入AOM指标、LTS日志和APM调用链,接入完成后,即可方便地在“指标浏览”、“日志管理”、“应用监控”等页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的LTS日志、APM调用链等信息。
按集群维度查看当前集群的节点、工作负载、Pod(容器组)和容器信息。 在左侧导航栏选择“洞察 > 节点”,可实时获取到该集群下查看该集群所有主机节点的概况,包括状态、IP地址、Pod状态、CPU使用率和内存使用率等信息。 在节点列表上方,可按节点名称设置过滤条件,实现节点列表过滤显示。 单击右上角的,通过选中或
添加或修改指标类或事件类告警规则 功能介绍 添加或修改AOM2.0指标类或事件类告警规则。 调用方法 请参见如何调用API。 URI POST /v4/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
错误码 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 更多服务错误码请参见API错误中心。 状态码 错误码 错误信息 描述 处理措施 200 SVCSTG.INV.2000000 null 请求正常执行 请求执行完成无需处理。 200 SVCSTG_AMS_2000000
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? UniAgent和ICAgent安装类常见问题 如何在VPCEP控制台为AOM/LTS创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? E
问题原因 状态异常说明您安装的AK/SK等凭据不正确,或者使用委托安装的方式但没有设置委托导致ICAgent状态异常。 解决方法 请参考如何通过创建委托获取AK/SK,获取AK/SK重新安装ICAgent即可。 父主题: 采集管理
公共请求消息头 表1 公共请求消息头 名称 描述 是否必选 示例 X-Auth-Token 用户Token。 使用Token认证时必选 - Content-Type 内容类型。 该字段内容填为“application/json;charset=utf8”。 必选 applicat
管理日志接入LTS规则 AOM支持本章为您介绍如何管理日志接入LTS规则,支持添加、查看、删除日志接入LTS的规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。
中划线,以字母开头。 主机 单击“添加主机”,在“添加主机”页面中选择用于配置采集任务和安装Exporter的主机: 可通过主机名称、IP地址和Agent状态搜索选择主机。 可通过右上角,取消已勾选的主机。 选择的主机必须是UniAgent状态为运行中的主机,否则创建的采集任务无法采集数据。
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都
接入AOM总览 AOM提供多场景、多层次、多维度指标与日志数据的监控能力,通过旧版接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 约束与限制 如果您进入的是新版接入中心,需要单击“
告警管理 如何区分告警和事件?
云服务接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将云服务相关指标接入AOM、将云服务相关日志接入LTS以及查看云服务日志接入LTS相关操作文档。 前提条件 已接入通用实例类型Prometheus监控,详情请参见创建Prometheus 通用实例。
*.***.***.***"}) by (nodeIP) 常用的普罗命令 常用的查询指标的普罗命令如表1所示,用户可根据实际修改其中的IP地址、ID等参数信息。 表1 常用的普罗命令 指标 标签定义 PromQL 主机CPU使用率 {nodeIP="",hostID=""} ao
费用账单 您可以在“费用中心 > 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,应用运维管理的按需
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。