检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。 如果您未创建任何通知规则,则无
应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(CBH)、云容器引擎(CCE)、内容分发网络(CDN)、云防火墙(CFW)、云审计服务(CTS)、分布式缓存服务(DCS)、文档数据库服务(DDS)、华为云DDoS防护服务(DDoS防护
DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN 指标 云服务接入AOM 开源监控系统接入 Prometheus通用实例 指标 开源监控系统接入AOM Prometheus API/SDK接入
单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。 对接线下Grafana 不支持 支持以Prometheus数据源的方式直接对接到线下Grafana。
AOM提供了告警通知功能,您可通过创建通知规则、告警行动规则或告警降噪进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。 监控 提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能。
Operator每秒发出的记录总数。 条/秒 flink_taskmanager_job_task_operator_sourceIdleTime Source 闲置时长。 毫秒(ms) flink_taskmanager_job_task_operator_source_numRecordsIn source收到的记录总数。
详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 您可以通过AOM的监控功能监控资源的使用情况,评估当前配置是否过高。例如:CPU、内存、带宽等资源的利用率。寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM通过Promet
数据源 说明 弹性伸缩 AS、专享版API网关(APIG)、云堡垒机(CBH)、云备份(CBR)、表格存储服务(CloudTable)、内容分发网络(CDN)、云搜索服务(CSS)、云专线(DC)、分布式缓存服务(DCS)、文档数据库服务(DDS)、数据湖探索(DLI)、分布式消息服务
到AOM。 传输存储层 数据传输:AOM Access是用来接收运维数据的代理服务,运维数据接收上来之后,会将数据投放到Kafka队列中,利用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassand
GPU内存带宽利用率 表示内存带宽利用率。以英伟达GPU V100为例,其最大内存带宽为900 GB/sec,如果当前的内存带宽为450 GB/sec,则内存带宽利用率为50%。 0~100 百分比(%) ma_container_gpu_enc_util GPU编码器利用率 表示编码器利用率
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。
DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机 CBH、消息通知服务 SMN、内容分发网络 CDN ModelArts服务默认自动将指标上报到AOM,其指标数据开箱即用。用户无需手动接入。 ModelArts指标的详细说明请参考基础指标-Modelarts指标。
选择您想要查看的实例,可以查看该实例对应的快照数据。 图4 查看快照列表 表7 快照列表参数说明 参数 说明 日期 获取调试信息的时间。 CPU核数 CPU利用率。 内存分配速率 内存的速度,代表该内存所能达到的最高工作频率。 实例名称 实例名称。 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: