检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建AOM指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建、按Prometheus命令创建。 约束与限制 当指标告警规则的状
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规
创建阈值规则 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 阈值规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行
创建AOM告警抑制规则 告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则
自定义插件接入AOM 您可以创建一个插件,在插件中通过脚本自定义需要上报到AOM的指标数据,并通过该自定义插件创建采集任务,即可采集自定义的指标数据到AOM,以监控该指标数据。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 创建自定义插件
管理定时运维 “定时运维”页面展示所有定时任务的执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作。定时任务单用户最多支持创建100个。 创建任务 登录AOM 2.0控制台。
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
删除仪表盘分组 功能介绍 该接口用于删除仪表盘分组。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/aom/dashboards-folder/{folder_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
运维管理概述 自动化运维服务依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重
创建应用 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。创建应用后,即可为该应用添加子应用、组件等信息,并可通过应用监控等功能实时监控业务的运行情况。 创建应用 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。
手动迁移AOM 1.0数据至AOM 2.0 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级
配置代理区域和代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区域是对代理机进行分类管理,由多个代理机组成。 配置代理区域和代理机 登录AOM
上报事件或告警信息 功能介绍 该接口用于上报事件或告警至AOM,同时支持清除告警信息。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/push/events 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
资源管理 资源管理对用户所有的各类云服务进行统一管理。可全局查看所有的云服务资源对象与应用的关联关系,包括未绑定应用的云资源,便于用户对资源进行分析和管理。 目前支持对以下资源类型的管理: 云服务器ECS,数据库(关系型数据库RDS、数据复制服务DRS、云数据库GaussDB NoSQL、云数据库
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
通过Debugging诊断方法 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。通过Debugging诊断方法,帮助用户快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 通过Debugging诊断方法 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
管理主机组 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“主机组管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。