检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env
为什么购买的资源在“资源管理”界面看不到? 如果确认资源购买成功,请先通过“资源>我的资源”查看是否有此资源。如果确认资源已经展示在“我的资源”处,即可在“资源管理”界面,单击“刷新”,即可显示相关资源。 图1 查看资源 图2 刷新“资源管理”界面 父主题: 应用资源管理(日落)
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择
组件列表总览 组件列表展示各个组件的指标监控项,包括:组件、环境、应用、url调用次数等信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件
约束与限制 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE Enterprise
线程分析 线程分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您快速定位耗时较高的线程。 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 线程分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧
配置CCE集群指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus
对象分析 对象分析用于分析某个对象内部状态,并查看对象参数值和详细信息。 对象分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页
AOM有哪些使用限制? 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE
正常状态的工作负载,AOM界面显示异常是什么原因? 在AOM页面看到工作负载的状态显示异常,但是实际上在CCE页面看工作负载是正常的。 图1 查看工作负载状态 可能的原因如下: ICAgent的版本过低。 ICAgent当前需要用户主动升级的,但是过旧的ICAgent版本可能存在状态上报延迟导致显示异常的问题
查询事件告警信息 功能介绍 该接口用于查询对应用户的事件、告警。 调用方法 请参见如何调用API。
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围
第三方云厂商/IDC/华为云其它Region自建Prometheus对接到AOM Prometheus实例 背景信息 云上用户经常会遇到多云或者跨region采集自建Prometheus场景,典型场景如:将自建IDC或者第三方云厂商的自建Prometheus对接到AOM Prometheus
添加节点 应用创建完成后,可为已创建的应用添加节点,包括组件和子应用。 添加节点 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目。 添加组件或子应用。有以下两种方式: 应用创建完成后,单击“继续创建应用树节点
ECS主机上执行UniAgent安装命令,下载安装脚本失败 问题描述 在通过华为云购买的ECS主机上执行UniAgent安装命令时,下载安装脚本失败,出现如下报错信息:Cloud not resolve host: aom-uniagent-xxxxxxxxxxxxxxxxxxxxxxxxxxxx
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度
安装ICAgent 前提条件 已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳板机转发命令不包含域名信息
查询指标类或者事件类告警规则列表 功能介绍 查询AOM2.0指标类或者事件类告警规则列表。(注:接口目前开放的region为:华东-上海一) 调用方法 请参见如何调用API。
调用链 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。 图1 查看调用链 在查询条件下输入查询条件查询具体的调用链列表,详细请参见表1
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器