-
全局拓扑 - 应用运维管理 AOM
拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计的,也可以是从被调用方统计的。单击线条,右边可以查看这个调用关系的趋势图。同时拓扑图也会标示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,快速定位问题。
-
自定义插件接入 - 应用运维管理 AOM
前提条件 主机已安装UniAgent。 已创建ECS Prometheus实例。 已创建自定义插件。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“采集管理”,进入“采集管理 > 采集任务”页面,单击“新增采集任务”。 在采集任务配置页面中,参考下表配置相关参数信息。 图1
-
其他组件接入 - 应用运维管理 AOM
前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“采集管理”,进入“采集管理 > 采集任务”页面,单击“新增采集任务”。 在配置页面中,参考下表配置相关参数信息。 图1 配置采集任务 表1
-
批量操作其他插件 - 应用运维管理 AOM
击“插件批量操作”。 在弹框中选择操作类型,配置对应的插件信息,并单击“确认”,即可执行对应的操作。 表1 插件操作参数配置表 参数 说明 操作类型 插件批量操作有三种操作类型:安装、升级、卸载。 选择插件 ICAgent,目前支持安装最新版本的ICAgent。 AK/SK AK/SK(Access
-
拓扑 - 应用运维管理 AOM
拓扑 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计的,也可以是从被调用方统计的,并且可以查看这个调用关系的趋势图。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
-
如何处理界面“ICAgent状态”为“离线”的问题? - 应用运维管理 AOM
grep proxyworkflow.go 若无回显信息,则说明AK/SK配置错误 => 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
-
如何处理界面“ICAgent状态”为“离线”的问题? - 应用运维管理 AOM
grep proxyworkflow.go 若无回显信息,则说明AK/SK配置错误 => 执行 3 若有回显信息,则说明AK/SK配置正确 => 执行4 配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
-
创建分组规则 - 应用运维管理 AOM
创建分组规则 使用分组规则,可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方
-
创建分组规则 - 应用运维管理 AOM
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
-
Memcached Exporter接入 - 应用运维管理 AOM
Memcached Exporter部署 登录CCE控制台。 单击已接入的CCE集群名称,进入该集群的管理页面。 执行以下操作完成Exporter部署。 配置密钥。 在左侧导航栏中选择“配置与密钥”,单击页面右上角“YAML创建”。YAML配置示例如下: apiVersion: v1
-
Memcached Exporter接入 - 应用运维管理 AOM
Memcached Exporter部署 登录CCE控制台。 单击已接入的CCE集群名称,进入该集群的管理页面。 执行以下操作完成Exporter部署。 配置密钥。 在左侧导航栏中选择“配置与密钥”,单击页面右上角“YAML创建”。YAML配置示例如下: apiVersion: v1
-
终端节点 - 应用运维管理 AOM
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
-
概述 - 应用运维管理 AOM
生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。 图1 新手介绍 父主题: 采集管理
-
文件管理 - 应用运维管理 AOM
个新主题,并为这个主题添加订阅。 单击“保存”完成创建。 执行安装/卸载任务 文件包创建完成后,您可以在文件列表页面对文件执行安装或卸载任务。执行脚本依赖uniAgent的能力,用户需要确保执行脚本的ECS实例已经安装uniAgent且为运行中状态。 在左侧导航栏中选择“文件管理
-
快速管理应用 - 应用运维管理 AOM
源”。 从资源列表中选择合适的资源实例。 资源列表仅展示与应用企业项目相同的资源。 图7 关联资源 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需要单击“关联资源&安装Agent”,在关联资源后继续完成Agent安装。安装Agent的详情操作请参见安装UniAgent。
-
Kafka Exporter接入 - 应用运维管理 AOM
方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka Exporter告警接入等操作。 为了方便安装管理Exporter,推荐使用CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群并已安装Kafka。 服务已接入可观测Prometh
-
Kafka Exporter接入 - 应用运维管理 AOM
方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka Exporter告警接入等操作。 为了方便安装管理Exporter,推荐使用CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群并已安装Kafka。 服务已接入可观测Prometh
-
AOM展示的日志是否为实时日志? - 应用运维管理 AOM
AOM展示的日志是否为实时日志? AOM展示的日志为近实时日志,日志存在秒级时延。 日志从采集上报到处理需要一定的时间,日志量较小时日志会存在10秒左右的时延,日志量特别大时时延会久些。 父主题: 日志分析
-
手动升级 - 应用运维管理 AOM
”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台。 在左侧导航栏中选择“告警 > 告警规则”。 选中一个或多
-
基础指标:IEF指标 - 应用运维管理 AOM
npu_temperature 芯片温度 Atlas 500小站节点NPU卡温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) npu_health npu_health 芯片健康状态 Atlas 500小站节点NPU卡的健康状态,由用户调用edgecore接口上报。 ≥0 无 ai_cpu_rate