检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
添加阈值规则(即将下线) 功能介绍 该接口用于添加一条阈值规则,包括如下工作。 URI POST /v1/{project_id}/ams/alarms 替换接口请参考添加阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
管理工具市场 工具市场会按照查看场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:管理脚本、管理文件。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
删除静默规则 功能介绍 删除静默规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
GET方法查询瞬时数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query 表1 路径参数
删除告警行动规则 功能介绍 删除告警行动规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
元数据查询 功能介绍 该接口用于查询指标的元数据。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/metadata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
GET方法查询区间数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query_range
管理日志接入 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“接入管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。
(推荐)POST方法查询瞬时数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language) 在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query
(推荐)POST方法查询区间数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query_range