检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控服务
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证:通过Token认证调用请求。 AK/SK认证 AK/SK签名认证方式仅支持消息体大小
概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能
虚机组件指标及其维度 AOM中,虚机组件指的是进程,虚机组件指标指的就是进程指标。 表1 进程指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用
权限管理 如果您需要对AOM资源给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes
数据多写 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类型
新增变量 通过新增变量可在仪表盘页面查看或新增图表时,自定义添加过滤器。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“仪表盘”。 如果您需要使用新版仪表盘功能,在左侧导航栏中选择“仪表盘”后,还需要单击页面右上角“体验新版”,切换至新版仪表盘界面。 选择待操作的仪表盘
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征
概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则
指标总览 简介 基础指标:虚机指标 基础指标:容器指标 基础指标:Modelarts指标 基础指标:IEF指标 基础指标:CSE指标 基础指标:IoTDA指标 基础指标:node-exporter指标 基础指标:Flink指标 指标维度
应用场景 提升用户体验 业务痛点 行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、
概述 本功能当前在华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理
组件列表 组件列表总览 拓扑 Profiler性能分析 Debugging诊断 接口调用 基础监控 异常 外部调用 通信协议 数据库 Web容器 消息队列 远程过程调用 日志 基础设施 调用链 组件设置 父主题: 应用监控
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题
线程分析 线程分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您快速定位耗时较高的线程。 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 线程分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧