检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您可根据需要对事件进行处理。用户可通过“事件”页面查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
应用概览 应用概览页面,展示应用维度的指标数据,包含核心指标,url调用次数,url平均响应时间等。同时支持“购买特惠包”以及“接入应用”。 查看应用概览 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。 图1
以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理
UniAgent 安装与配置 安装UniAgent 批量操作UniAgent 批量操作其他插件 其他相关操作 父主题: 采集设置
监控Node.js应用 快速接入Agent 手动接入Agent 父主题: 接入中心
workflow_id 是 String 任务id,从工作流命令列表中获取的工作流id。 最小长度:1 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。 最小长度:1 最大长度:40960
概述 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满
统计资源消耗 通过Prometheus监控服务将指标数据上报到AOM后,即可在“资源消耗”界面查看上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for ECS Prometheus实例
ogback产生的日志直接上报至云日志服务。具体操作请参见:接入日志(LTS)。 跨账号接入 - 日志流映射 通过创建委托,您可以将委托方账号的日志流映射到被委托方账号的日志流。具体操作请参见:接入日志(LTS)。 自定义 Prometheus 格式指标 接入自定义 Prometheus
校验不通过可能会导致风险。高危命令的详细说明请参见表1。 执行策略 分批发布 选择是否开启分批发布开关,默认不打开。 每批发布 开启分批发布后需填写每批发布数量。 每批间隔 开启分批发布后需填写每批发布的时间间隔。 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审
ICAgent版本说明 表1 ICAgent版本说明 版本号 说明 5.12.135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。
接入LTS 概述 管理接入规则 父主题: 日志分析(旧版)
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
基础认证:输入用户侧Prometheus的用户名和密码。 Token:输入访问用户侧Prometheus的Token。 无认证:无需认证,即可访问用户侧Prometheus。 设置完成后,单击“保存”。 等待大约5分钟,即可看到在用户侧的自建Prometheus中查看到上报的指标数据。 父主题: Prometheus监控
示资源的TMS标签”开关。 图1 开启或关闭指标配置开关 关闭“指标采集开关”后,ICAgent会停止指标数据采集,相关指标数据不再更新,用户自定义指标还可以继续上报。 父主题: 配置管理
监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项 主机状态包含“正常”、“异常”、“亚健康”、“通道静默”、“已删
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理