检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
镜像概述 镜像是一个包含了软件及必要配置的云服务器或裸金属服务器模板,包含操作系统或业务数据,还可以包含应用软件(例如,数据库软件)和私有软件。镜像分为公共镜像、私有镜像、共享镜像和市场镜像。
当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。
例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>=3”,频率为“每5分钟”,则表示20分钟内发生数据卷扩容失败事件的次数累计达到或超过3次,则每5分钟发送一次告警通知直到告警被清除。
对象存储服务 对象存储服务(Object Storage Service,简称OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。 AOM支持将日志转储到OBS的桶中,以便长期存储。
图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。
LakeFormation、表格存储服务 CloudTable、MapReduce服务 MRS、数据仓库服务 GaussDB DWS、数据湖探索 DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN
>0 兆字节(MB) NPU存储使用率(aom_container_npu_memory_usage) 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。
详情请参见监控AOM系统指标数据。
对象存储服务 对象存储服务(Object Storage Service,简称OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。 AOM支持将日志转储到OBS的桶中,以便长期存储。
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入规则配置中。配置接入规则时以主机组为单位下发采集配置,方便对多台主机数据进行采集。
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入规则配置中。配置接入规则时以主机组为单位下发采集配置,方便对多台主机数据进行采集。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。
表1 自建中间件接入AOM 卡片 相关操作 MySQL 关系型数据库,稳定高效,支持大量数据,广泛应用于网站和应用开发。具体操作请参见: MySQL日志接入(LTS) MySQL指标接入(AOM) Redis 内存数据结构存储系统,支持多种类型,用作数据库、缓存和消息代理。
添加容器挂载 *主机路径 容器内日志文件所在路径挂载到主机上的位置,如:/var/paas/sys/log/nginx 挂载路径 输入数据逻辑卷挂载到容器上的路径,如:/tmp 须知: 请不要挂载在系统目录下,如“/”、“/var/run”等,会导致容器异常。
数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。 图1 账号接入界面 父主题: Prometheus监控
(ER)、云硬盘(EVS)、函数工作流(FunctionGraph)、GaussDB for MySQL、云数据库(GeminiDB)、设备接入服务(IoTDA)、智能边缘平台(IEF)、ModelArts、MapReduce服务(MRS)、NAT网关(NAT)、对象存储服务(OBS
Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。
配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 通过Grafana查看Prometheus实例数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus
AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。