检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。
添加或修改服务发现规则 功能介绍 该接口用于添加或修改一条或多条服务发现规则。同一projectid下可添加的规则上限为100条。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数
删除事件类告警规则 功能介绍 删除一条事件类告警规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取
查询事件告警信息 功能介绍 该接口用于查询对应用户的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
查询标签值 功能介绍 该接口用于查询指定标签名的值 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/label/{label_name}/values 表1 路径参数 参数 是否必选 参数类型 描述 label_name 是
上报事件或告警信息 功能介绍 该接口用于上报事件或告警至AOM,同时支持清除告警信息。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/push/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
请单击“立即接入”或者单击页面右上角的“接入管理”,接入完成后,即可监控该云服务。 接入云服务前,需要先为云服务选择所属的企业项目。如果事先已在全局页面选择具体的企业项目,此处无需再设置。如果在全局页面设置为“全部企业项目”,请从下拉列表中选择。
AOM Redis指标接入AOM Kafka指标接入AOM Nginx指标接入AOM MongoDB指标接入AOM Consul指标接入AOM HAProxy指标接入AOM PostgreSQL指标接入AOM Elasticsearch指标接入AOM RabbitMQ指标接入AOM 管理中间件采集任务
GET方法查询瞬时数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在特定时间点下的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query 表1 路径参数
GET方法查询区间数据 功能介绍 该接口使用GET方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/query_range
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题
删除策略 功能说明 该接口用于删除指定策略。 URI DELETE /v1/{project_id}/pe/policy 请求消息 请求消息头 请求消息头如表1所示。 表1 请求消息头 参数 描述 是否为必选 示例 Deployment-Name 应用名 必选 - Policy-Id
方式二 登录华为云管理控制台。 在左上角单击,在下拉列表中选择操作区域。 单击左侧,选择“管理与监管> 应用运维管理 AOM ”,进入AOM 2.0服务页面。 如果您直接进入AOM 1.0服务页面,可在左侧导航栏单击“体验新版”,进入AOM 2.0服务页面。
告警标签说明 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key和value只能包含中文、字母、数字和下划线。
如果需要在CCE类型Prometheus实例的详情页使用更多功能,需提前获取CCE的相关权限,详情请参见CCE权限管理。 接入CCE集群 登录AOM 2.0控制台。 选择“Prometheus监控 > 实例列表”。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息
获取Prometheus实例调用凭证 功能介绍 该接口用于获取Prometheus实例调用凭证。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/access-code 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:event2AlarmRule