检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0控制台中“一键告警”功能由云监控服务CES提供。用户可在AOM 2.0控制台界面操作,也可登录CES控制台界面操作。 约束与限制 如果需要在AOM控制台中使用CES的功能,需要提前获取CES的相关权限,详情请参见CES权限管理。 “一键告警”功能当前仅华南-广州区域受限开放,如有需求可以通过提交工单,为您开放此功能。
在左侧导航栏中选择“日志分析 > 日志路径”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。 在虚机列表中单击虚机所在行“操作”列的,为单个虚机配置一条或多条日志采集路径。 您既可使用ICAgent自动识别的路径,也可手动配置。 使用ICAgent自动识别的路径 I
CPU内核占用(aom_process_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(
AOM 2.0默认支持的指标存储时长为15天。15天内免费使用,超过15天则按量累计计费。 0.01元/百万条/天 数据转储量 AOM支持的指标数据转储量,按量累计计费。 0.2元/GB 计费示例 以自定义指标上报量使用场景为例。下面的价格仅为示例,实际计算请以价格计算器中的价格为准。
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”。 单击右上角“购买特惠包”,进入购买特惠包页面。如果右上角显示“您当前使用:免费版”,即您使用的是免费版APM探针,则没有“购买特惠包”按钮,无需购买。 在选择区域栏,选择购买的区域。 按需选择“企业版**级Agent包”
通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等 接入基础设施层指标 接入容器指标 接入云服务指标 图1 AOM四层指标体系 前提条件 已将ELB日志接入LTS。
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。 创建分组规则:使用分组规则功能,从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 创建全量指标告警规则:通过设置告警规则并关联分组规则,实时监控环境中主机、组件等资源使用情况。 前提条件
可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中
实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus
ma_container_memory_util 物理内存使用率 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100 百分比(%) ma_container_memory_used_megabytes 物理内存使用量 该指标用于统计测量对象实际已经使用的物理内存(对应containe
应用运维管理AOM API 使用AOM的OPEN API上报指标数据。具体操作请参见:使用API将指标接入(AOM)。 云日志LTS API 使用LTS的OPEN API上报日志数据。具体操作请参见:使用API将日志接入 (LTS)。 应用性能监控APM API 使用APM的OPEN A
在下拉列表中选择您想要查看的APM实例,可以查看该实例下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击进行刷新,有两种方式刷新方式:手动刷新和自动刷新。
添加日志桶 日志桶是对日志文件逻辑上的分组。用于以日志桶为单位查看日志等,使用这些功能前您需先添加一个日志桶。 注意事项 每个日志桶最多可添加500个日志文件。 同一个日志桶中只能添加同一个集群的日志文件。 添加日志桶 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”。
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
异常日志,可以查看该实例在对应采集器下的应用异常监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_
中间件及自定义插件接入AOM总览 AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持快捷安装Prometheus官方中间件Exporter,及自定义插件。通过为中间件及自定义插件创建采集任务,并执行插件脚本,AOM就可以对相应的中间件及自定义插件指标进行监控,结合开源G
us_JVM_CPU_Time jobmanager中JVM使用的CPU时间。 无 flink_jobmanager_Status_ProcessTree_CPU_Usage JobManager 中JVM的CPU使用率。 无 flink_taskmanager_Status_JVM_CPU_Load