检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 AOM提供告警行动规则定制功能,,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则
父主题: 运维管理(日落)
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout
≥0 伏(V) npu_temperature npu_temperature 芯片温度 Atlas 500小站节点NPU卡温度,由用户调用edgecore接口上报。
父主题: 采集管理
父主题: 采集管理
创建静态阈值模板 使用模板创建阈值规则前需要先创建一个静态阈值模板。 注意事项 您最多可创建50个静态阈值模板,如果静态阈值模板数量已达上限50个时,请删除不需要的静态阈值模板后重新创建。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”。 在“静态阈值模板”页签下
查看资源信息的详细操作请参考资源管理。 父主题: 运维管理(日落)
应用资源管理:通过应用管理、资源搜索等功能,将所有资源对象与应用统一管理,为AOM上层运维场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。
父主题: 采集管理
图1 创建快速分析 在展开的“管理快速分析”界面,选择快速分析的字段。 图2 管理快速分析 单击“确定”,快速分析创建完成。 图3 查看快速分析 表示String类型字段。 表示float类型字段。 表示long类型字段。 快速分析的字段长度最大为2000字节。
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择
也可单击“保存”,将创建好的任务展现在任务管理页面,方面后续对任务进行执行或其他操作。 父主题: 服务场景
也可单击“保存”,将创建好的任务展现在任务管理页面,方面后续对任务进行执行或其他操作。 父主题: 服务场景
仪表盘:仪表盘常见问题 告警管理:告警管理常见问题 日志分析:日志分析常见问题 Prometheus监控:Prometheus监控常见问题 容器洞察:容器洞察常见问题 应用监控:应用监控常见问题 应用资源管理:应用资源管理常见问题 运维管理:运维管理常见问题 采集管理:采集管理常见问题
父主题: 应用资源管理(aom2.0接口)
创建执行方案的详细操作请参考作业管理。 父主题: 运维管理(日落)
父主题: 应用资源管理(aom2.0接口)
0~100 百分比(%) NPU温度(aom_node_npu_temperature_centigrade) 该指标用于统计NPU的温度。
父主题: 配置管理