检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置多账号聚合实现指标统一监控 多账号聚合Prometheus实例类型,提供对同一组织下多个成员账号的云服务指标监控。 前提条件 已在组织控制台界面启用AOM 可信服务,具体操作请参见启用、禁用可信服务。 同一组织下多个成员账号均已接入云服务指标。 约束与限制 只有组织管理员或委托管理员账号才可以创建多账号聚合
新增消息通知模板 功能介绍 该接口用于新增消息通知模板。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
应用监控概述 AOM作为华为云服务可观测性分析统一入口,自身并不具有应用性能管理服务的功能,AOM 2.0控制台中应用监控配置相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一
查询消息通知模板列表 功能介绍 该接口用于查询消息通知模板列表。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
通过AOM监控云服务 云服务监控页面以曲线图、数字图等形式直观展示华为云各服务实例的运行状态、各个指标的使用情况等信息。当前支持在的云服务监控页面查看监控信息的云服务,包括:函数工作流 FunctionGraph、对象存储服务 OBS、弹性公网IP和带宽、弹性负载均衡 ELB、NAT
修改消息通知模板 功能介绍 该接口用于修改消息通知模板。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/events/notification/templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建AOM告警静默规则 告警静默规则功能可以在指定时间段屏蔽告警通知。 约束与限制 您最多可创建100条静默规则,如果静默规则数量已达上限100时,请删除不需要的静默规则。 静默规则一旦创建完成,即刻生效。 创建告警静默规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多账号聚合实例
应用资源管理概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制
附录 状态码 错误码 获取账号ID、项目ID、企业项目ID 公共请求消息头 公共响应消息头
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM
创建AOM告警抑制规则 告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效
快速管理应用 本章节介绍在“总览”页面的应用视角下,如何通过AOM快速管理应用,包括应用创建到发现、监控等操作。主要操作如下: 创建应用:通过CMDB创建应用和资源关系树,在应用所在主机安装采集器。 配置告警:创建指标告警规则,应用异常时发送通知。 配置告警行动规则:配置告警处理策略
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、
修改Prometheus实例 功能介绍 该接口用于修改Prometheus实例。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多
UniAgent管理 “√”表示支持,“x”表示暂不支持。 表1 UniAgent管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 下发批量安装UniAgent任务 POST /v1/{project_id}/uniagent-console
Prometheus实例 “√”表示支持,“x”表示暂不支持。 表1 Prometheus实例 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 卸载托管Prometheus实例 DELETE /v1/{project_id
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态