检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
同一资源集下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。 配置虚机日志的采集路径时,不建议和容器服务日志映射到虚拟机上的日志目
Prometheus实例 for ECS ECS Prometheus实例类型,适合需要在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS 集群)运行Prometheus监控的场景,可以通过接入中心添加Prometheus中间件监控。 创建ECS Prometheus实例 登录AOM
指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。此处根据3中监控的工作负载设置条件。 集群名称=aom-doc-test AND 工作负载名称=coredns 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
如何为执行方案配置审批? 无法单独为执行方案配置审批,执行方案会继承作业的审批配置。 解决方法 在创建作业时,对该作业设置“审批配置”(默认关闭),则由该作业创建的执行方案执行时就需要审批。创建作业的详细操作请参考作业管理。 父主题: 运维管理(日落)
该主机ICAgent功能异常,请联系技术人员处理。 安装前提 在进行ICAgent安装前,需要先确保本地浏览器时间与服务器时区、时间都一致。若有多个服务器,则要保证本地浏览器、多个服务器的时区、时间都一致。否则,可能会导致安装后不能在界面上准确查看应用、服务器的指标数据。 安装方式说明 ICAgent
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
当前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持。 表3 监控数据处理 功能 功能说明 获取Prometheus实例的服务地址 使用Remote Read地址和Remote Write地址,将自建Prometheus的监控数据存储到AO
其中{region_name}和{version}均可在安装界面获取: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 version:当前所安装的Uniagent的版本。
主机ICAgent安装失败,请登录服务器卸载后重新安装。 升级中 正在为主机升级ICAgent,升级ICAgent预计需要1分钟左右,请耐心等待。 升级失败 主机ICAgent升级失败,请登录服务器卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。
脚本查询 功能介绍 该接口是脚本主页查询,可指定脚本名称和脚本创建人进行精确查询,返回包含脚本基本信息的列表数据。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/script/list 表1 路径参数 参数 是否必选 参数类型 描述
勾选一个或多个待重装UniAgent服务器前的复选框,然后执行如下操作: 旧版“虚机接入”页面:单击“UniAgent批量操作 > 重装”,然后在弹出的页面中,按照界面提示重新安装UniAgent。 新版“UniAgent 安装与配置”页面:在“ECS云服务”或“其他服务器”页签中单击“重装”,
CCI”卡片,可查看已接入的CCI指标。自动上报到AOM的CCI指标,详细说明请参见基础指标-虚机指标。 单击“弹性云服务器 ECS”卡片,在“弹性云服务器 ECS”弹框中安装Node Exporter,具体操作请参见弹性云服务器 ECS接入。 Prometheus 云服务接入 通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
管理接入规则 本章为您介绍如何添加、查看、删除接入规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南、CCI用户指南;已配置容器服务日志采集路径。 添加接入规则
参数名称 参数说明 触发条件 统计周期 指标数据按照所设置的统计周期进行聚合。默认只统计一个周期,最多可统计5个周期指标数据。 连续周期 连续多少个周期满足阈值条件后,发送阈值告警。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 阈值条件
给企业中不同职能部门的员工创建IAM用户,还可以根据企业用户的职能设置不同的访问权限。 购买云主机(必选) 每一台主机对应云上的一台虚拟机(例如:弹性云服务器ECS)或物理机(例如:裸金属服务器BMS)。主机可以在ECS、BMS直接购买,也可以通过CCE间接购买。 安装ICAgent(必选) I