检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。
当前仅华南-广州区域“告警管理”菜单名称更名为“告警中心”,“告警行动规则”菜单名称更名为“告警通知”,“告警行动规则”页签名称更改为“通知规则管理”。 创建方式 按照配置方式的不同,创建日志告警规则可分为:按关键词统计创建、按搜索分析创建、按SQL统计创建。
在左侧导航栏中选择“告警管理 > 告警降噪”。当前仅华南-广州区域的菜单路径为“告警中心 > 告警降噪”。 在“静默规则”页签下单击 “创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1 设置静默规则 类别 参数名称 说明 - 规则名称 静默规则的名称。
根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见:将Prometheus的数据上报到AOM。 父主题: Prometheus监控
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息
再如,在“运维概览”界面和“仪表盘”界面均设置了在线时长,则以最后一次设置为准。 全屏模式在线时长优先级高于系统在线超时退出机制。
获取Prometheus实例调用凭证 功能介绍 该接口用于获取Prometheus实例调用凭证。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/access-code 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
更新策略 功能说明 该接口用于修改策略规则。告警策略支持更新,定时和周期策略不支持更新。 URI PUT /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则
通过创建委托,ICAgent自动获取用户的访问密钥(AK/SK)帮助用户进行应用性能管理。 创建委托 登录华为云控制台。 单击右上角的用户名称,如图1,选择“统一身份认证”。 图1 用户名称 在“统一身份认证”页面中,单击“委托”,进入委托页面。
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
查询策略组属性 功能说明 该接口用于查询策略组属性。 URI GET /v1/{project_id}/pe/policy/config 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID 请求消息 请求消息头 请求消息头如表2所示。
约束与限制 如果需要在AOM控制台中使用CES的功能,需要提前获取CES的相关权限,详情请参见CES权限管理。 “一键告警”功能当前仅华南-广州区域受限开放,如有需求可以通过提交工单,为您开放此功能。
通道静默 当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致: 可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明
删除指标类或事件类告警规则 功能介绍 删除AOM2.0指标类或事件类告警规则。 调用方法 请参见如何调用API。 URI DELETE /v4/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询事件类告警规则列表 功能介绍 查询事件类告警规则列表。(该接口为aom1.0界面接口,该接口即将下线,建议使用aom2.0接口查询指标类或者事件类告警规则列表接口)。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/event2alarm-rule
查看单个策略 功能说明 该接口用于查询指定项目下单个策略的详细信息。 URI GET /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1。 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID policy_id
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述