检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
导致通知发送失败 为主题添加相关的订阅者,即通知的接收人(例如,邮件或短信),SMN可以实时地将告警信息以广播的方式通知这些订阅者,操作详见订阅主题。 例如,订阅者设置为该运维人员的邮箱。 创建通知规则:输入规则名称,选择通知条件,选择2中已创建的主题,根据实际选择时区/语言,输
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
单击“确定”,即可新增一个代理区域。 选择新增的代理区域,单击“添加代理机”,配置相关代理机参数信息。 表2 代理机参数说明 参数 说明 示例 代理区域 选择已创建的代理区域。 qwsertyddfsdfdf 主机 选择已安装UniAgent的主机。 - 代理IP 配置代理机的IP地址。 - 端口 端口号,必须小于或等于65535。
环境类型区分包括:正式、测试。 环境标签 为环境设置的一个属性,多个环境可能具有相同的的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定 将资源对象与应用下的环境建立关联关系,在同一个应用下资源对象实例可属于多个环境。 解绑资源
告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创
如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
管理采集插件平台UniAgent 安装UniAgent 安装UniAgent(新版) 管理主机的UniAgent 管理主机的ICAgent插件 管理CCE集群的ICAgent插件 管理主机组 管理主机组(新版) 配置代理区域和代理机 查看操作日志 父主题: 接入AOM
表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 错误码 表6 错误码 错误码 错误信息 处理措施 SVCSTG_AMS_4000101 Invalid alarm name. 请检查对应的参数是否符合要求。
dimensions 是 String - 指标维度,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 unit 是 String - 指标单位,此参数在后台将以添加阈值规则时传入的值保存,此处传入的值不能将其修改。 actionEnabled 否 Boolean - 告警是否启用
说明: 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表7 - 包含扩缩容的实例数。 表7 parameters字段数据结构说明 参数名称 是否必选 参数类型 取值范围 描述 scale_unit 是 Integer 在策略组的最小实例数与最大实例数之间
定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件 编辑作业后,作业的执行方案未更新 执行脚本任务失败,提示
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。 5.12.130 支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 错误码 表6 错误码 错误码 错误信息 处理措施 SVCSTG_AMS_4000109 Invalid project ID. 请检查对应的参数是否符合要求。
) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes) 总的磁盘空间容量。 ≥0 兆字节(MB) 磁盘读写状态(aom_node_disk_rw_status) 该指标用于统计主机上磁盘的读写状态。 0、1
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。 1:主题下的订阅列表存在状态为“已订阅”的订阅信息。 2:主题下的订阅信息状态处于“未订阅”或“已取消”。 枚举值: 0 1 2 topic_urn 是 String Topic的唯一的资源标识。 最小长度:1
在左侧导航栏,单击“委托”,进入委托页面。 单击右上角“创建委托”,进入创建委托页面。 参考表1设置创建委托的参数。 表1 创建委托 名称 说明 样例 委托名称 标识该委托代理的名称。 须知: 委托名称必须为apm_admin_trust。 - 委托类型 选择“云服务”。 云服务 云服务