检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus实例 卸载托管Prometheus实例 查询Prometheus实例 新增Prometheus实例 创建Prometheus实例的预聚合规则 获取Prometheus实例调用凭证 修改Prometheus实例 父主题: API
应用资源管理(aom2.0接口) 新增应用 删除应用 查询应用详情 修改应用 新增组件 删除组件 查询组件详情 修改组件 创建环境 删除环境 查询环境详情 修改环境 查询绑定在节点上的资源列表 根据应用名称查询应用详情 根据环境名称查询环境详情 根据组件名称查询组件详情 新增子应用
基本概念 应用资源管理 资源监控 自动化运维 采集管理
云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理
virtualServiceName Istio虚拟服务名。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 进程指标 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。
智能洞察(BETA) 开通智能洞察 通过AOM查看事件巡检数据 通过AOM查看事件根因分析结果 通过AOM查看故障传播链
应用监控 应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
应用管理 应用管理的使用说明 创建应用 添加节点 添加环境 关联资源 父主题: 应用资源管理
自动化运维权限管理 创建用户并授权使用自动化运维 自动化运维自定义策略 父主题: 运维管理
运维配置 管理OS账号 管理访问凭证 查看场景分类 父主题: 运维管理
配置AOM告警通知 创建AOM告警消息模板 创建CES通知对象和通知组 创建AOM告警行动规则(告警通知规则) 父主题: 告警监控
接入AOM(新版) 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 组件层接入AOM 中间件接入AOM 运行环境接入AOM 云服务接入AOM API开源协议及其他组件接入AOM 管理指标接入和日志接入
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。
服务器不可用 请联系技术支持工程师解决。 503 AOM.04008503 Server unavailable. 服务器不可用 请联系技术支持工程师解决。 503 AOM.07001503 Service error. 服务异常 请检查后台服务是否正常。
子应用可以理解为服务,对组件/微服务的归组分类。 组件:构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。
- 委托类型 选择“云服务”。 云服务 云服务 请选择“应用运维管理 AOM”。 - 持续时间 选择“永久”。 永久 描述 可选参数,用于补充说明该委托代理的详细信息。 - 在“权限选择”区域,单击“配置权限”。
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets
≥0 兆字节(MB) 表2 容器指标维度 维度 说明 appID 服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName 容器名称。