检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
RabbitMQ指标接入AOM 您可以直接使用AOM提供的RabbitMQ Exporter插件给主机创建采集任务,并安装RabbitMQ Exporter插件,就可以监控RabbitMQ相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
RabbitMQ指标接入AOM 您可以直接使用AOM提供的RabbitMQ Exporter插件给主机创建采集任务,并安装RabbitMQ Exporter插件,就可以监控RabbitMQ相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
环境。 执行方案 从作业模板中挑选1个或多个步骤组合组成执行方案。是作业模板的实例化对象。 云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标
启动ECS实例 使用启动ECS实例卡片可以创建任务,用来启动一个或多个ECS实例。 创建启动ECS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“启动ECS实例”卡片,
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。 可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。 通过应用发现功能发现的应用,当应用规则被停止或删除时,应用也会同时被停止或删除,
的。 DNS服务器地址与3中的nameserver保持一致。 图4 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS,需重启ECS服务器后生效。 添加安全组(管理控制台方式):登录管理控制台后,修改ECS安全组规则。操作步骤如下: 在管理控制台左上角选择区域和项目。
TCP端口验证结果 在浏览器地址栏里输入“http://跳板机ECS的IP地址”。如果访问成功,说明安全组规则已经生效。 如果跳板机ECS掉电重启,请重新执行如上命令。 获取AK/SK,请参考获取AK/SK。 生成ICAgent安装命令,并复制该命令。 在文本框中输入DC和跳板机连接IP,生成ICAgent安装命令。
TCP端口验证结果 在浏览器地址栏里输入“http://跳板机ECS的IP地址”。如果访问成功,说明安全组规则已经生效。 如果跳板机ECS掉电重启,请重新执行如上命令。 获取AK/SK,请参考获取AK/SK。 生成ICAgent安装命令,并复制该命令。 在文本框中输入DC和跳板机连接IP,生成ICAgent安装命令。
选择探针的版本。探针版本的类型建议与工作负载所在node节点的CPU架构对应版本一致。 探针升级策略 探针升级的方式、策略。默认为“重启自动升级”。 重启自动升级:每次都尝试重新下载镜像。 重启手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。 APM环境 输入APM环境名称,该参数为选填。
将复制的Remote Read Prometheus配置代码添加到对应用户自建Prometheus的prometheus.yml文件中。 重启用户自建的Prometheus服务。 即可在用户侧的自建Prometheus中查看AOM的Prometheus数据。 Remote Read完整配置项说明
基础指标:虚机指标 介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage
附录 状态码 错误码 获取账号ID、项目ID、企业项目ID 公共请求消息头 公共响应消息头
d/目录下有AOMInstall开机启动脚本,即设置成功。 执行以下命令,删除配置脚本。执行完之后,即可制作镜像,制作私有镜像之前,Linux机器不能重启。 rm -f /root/install_uniagentd_self_OS.sh 在目标ECS弹性云服务器的操作列单击“创建镜像”去创建私有镜像,详细操作请参考创建镜像。
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 创建CES告警屏蔽规则 父主题: 告警监控
创建AOM指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建、按Prometheus命令创建。 约束与限制 当指标告警规则的状
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM