检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
或者计算相对复杂的指标进行提前计算;尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高指标查询性能,解决用户配置以及查询慢的问题。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例 for CCE。
sum(aom_node_cpu_limit_core{nodeIP="***.***.***.***"}) by (nodeIP) 示例三:集群下运行的Pod内存配额申请值 / 集群下该Pod所在节点的内存可分配量 定义变量: pod中给容器分配的内存总量:aom_container_memory_request_megabytes
配置AOM告警通知 创建AOM告警消息模板 创建CES通知对象和通知组 创建AOM告警行动规则(告警通知规则) 父主题: 告警监控
创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 创建CES告警规则 创建CES一键告警 批量创建AOM云服务告警规则 创建CES告警模板 管理AOM告警规则 标签和标注 普罗语句说明 父主题: 告警监控
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 is_turn_on 否 Boolean
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 创建CES告警屏蔽规则 父主题: 告警监控
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口中,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 最小值:1 最大值:5 is_turn_on
CES控制台入口 参考文档链接 云监控 云监控服务支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。 在您使用告警模板创建告警规则之前,云监控服务已经根据各个云服务的应用属性以及云监控服务多年的开发、维
实时采集应用性能相关的数据。您可以管理APM探针启停状态。 管理APM探针启停状态。 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 探针管理”,进入探针管理页面。 设置搜索条件,筛选出满足搜索条件的Agent。支持按照“应用”、“组件”、“环境”、“IP”或“主机名”条件进行筛选。
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
务健康和稳定保驾护航。 本入门以业务指标监控大屏为例,向您介绍如何将AOM中的监控数据呈现在大屏页面中,以及如何对页面进行二次开发。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制 如果需要在AOM控
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 错误码 请参见错误码。 父主题: 监控
创建CES告警模板 AOM作为华为云服务可观测性分析统一入口,自身并不具有云监控服务功能,AOM 2.0控制台中“告警中心 > 告警模板”下的“云监控”功能由云监控服务CES提供。用户可在AOM 2.0控制台界面操作,也可登录CES控制台界面操作。 注意事项 如果需要在AOM控制
一个条件则触发告警。 多指标 指标 需要监控的指标。单击“指标”文本框,通过下拉框右侧的资源树,可以按资源类型快速选择需监控的指标。 node_network_up 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。
应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警。 创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 创建云监控告警规则 云监控服务支持灵
极限条件。 dimensions Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口中,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods Integer 间隔周期。 id_turn_on Boolean
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制
一个条件则触发告警。 多指标 指标 需要监控的指标。单击“指标”文本框,通过下拉框右侧的资源树,可以按资源类型快速选择需监控的指标。 node_network_up 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。