检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
可快速接入API开源协议及其他组件相关指标。 接入调用链(APM):AOM提供API开源协议及其他组件调用链接入APM的入口。通过卡片的“接入调用链(APM)”链接,可快速接入API开源协议及其他组件相关调用链。 接入日志(LTS)简介:AOM提供API开源协议及其他组件日志接入LTS的入口。
主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能由字母、数字和下划线组
IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN 指标 云服务接入AOM 开源监控系统接入 Prometheus通用实例 指标 开源监控系统接入AOM Prometheus API/SDK接入 应用运维管理AOM API
应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(CBH)、云容器引擎(CCE)、内容分发网络(CDN)、云防火墙(CFW)、云审计服务(CTS)、分布式缓存服务(DCS)、文档数据库服务(DDS)、华为云DDoS防护服务(DDoS防护
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes)
自动化运维自定义策略 如果系统预置的自动化运维权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服
主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key和value只能包含中文、字母、数字和下划线。
数据源 说明 弹性伸缩 AS、专享版API网关(APIG)、云堡垒机(CBH)、云备份(CBR)、表格存储服务(CloudTable)、内容分发网络(CDN)、云搜索服务(CSS)、云专线(DC)、分布式缓存服务(DCS)、文档数据库服务(DDS)、数据湖探索(DLI)、分布式消息服务
就可以对中间件上报到AOM的指标进行监控,结合AOM应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。AOM支持监控的具体指标请参见“开源社区Exporter列表”。 为了快速了解并进行中间件的指标接入AOM服务,建议您按照如下步骤进行操作:
接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
Prometheus监控概述 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQ
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。 对接线下Grafana 不支持 支持以Prometheus数据源的方式直接对接到线下Grafana。
AOM告警监控概述 AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。
阈值告警最佳实践(旧版) 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。
创建AOM指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建、按Prometheus命令创建。 约束与限制 当指标告警规则的状
将Prometheus的数据上报到AOM 如果您已经部署并正在使用开源prometheus,可直接进行步骤三。 本章主要介绍通过部署Prometheus将AccessCode配置到Prometheus的配置文件并使之生效。 前提条件 已购买弹性云服务器ECS。 操作步骤 安装并启
通过Debugging诊断方法 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。通过Debugging诊断方法,帮助用户快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 通过Debugging诊断方法 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控