检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
AOM 2.0默认支持的指标存储时长为15天。15天内免费使用,超过15天则按量累计计费。 0.01元/百万条/天 数据转储量 AOM支持的指标数据转储量,按量累计计费。 0.2元/GB 计费示例 以自定义指标上报量使用场景为例。下面的价格仅为示例,实际计算请以价格计算器中的价格为准。
机状态为“异常”。 主机监控 在左侧导航栏中选择“主机监控”,查看主机列表。 为了方便您查看主机列表,您可以: 单击右上角图标对主机列表进行过滤显示,实现隐藏控制节点。 可以在主机列表上方设置过滤条件,实现主机列表过滤显示。 您可根据需要选择是否对主机执行如下操作: 添加别名 当
基于CMDB模型,从应用、组件到环境对资源健康状态分层监控。 部分支持 不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标
CPU内核占用(aom_process_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(
添加日志桶 日志桶是对日志文件逻辑上的分组。用于以日志桶为单位查看日志等,使用这些功能前您需先添加一个日志桶。 注意事项 每个日志桶最多可添加500个日志文件。 同一个日志桶中只能添加同一个集群的日志文件。 添加日志桶 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”。
在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。
ma_container_memory_util 物理内存使用率 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100 百分比(%) ma_container_memory_used_megabytes 物理内存使用量 该指标用于统计测量对象实际已经使用的物理内存(对应containe
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指标存储时长功能受限白名单开放,如有需求可以通过提交工单,为您开放此功能。 配置指标存储时长 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 其他相关操作 AccessCode创建完成后,您还可以对AccessCode列表执行表1中的操作。 表1 相关操作 操作 说明 查看AccessCode 在列表中,可查看ID、AccessCode、状态、创建时间等信息。
/v2/{project_id}/series 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,也可以从调用API处获取。获取方式请参见:获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 limit 否 String 用于限制本次返回的结果数据条数。
告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创
上的“接入指标(AOM)”进入卡片详情页。 在“采集任务”页签中,您可以对该中间件已创建的采集任务进行管理。具体操作如下: 表1 相关操作 操作 说明 查看采集任务 单击采集任务名称,跳转到采集任务的详情页,可以查看该采集任务的详细配置信息。 启动/停用采集任务 单击采集任务对应
若没有合适的消息模板,请单击消息模板选择栏右侧“创建消息模板”,新建消息模板,操作详见创建消息模板。 设置完成后,单击“确定”。 更多操作 告警行动规则创建完成后,您还可以执行表2中的相关操作。 表2 相关操作 操作 说明 编辑告警行动规则 单击“操作”列的“编辑”。 删除告警行动规则 删除单条规则:单击对应
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 “日志采集
涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。 获取指定告警行动规则的详细信息 接口相关信息 URI格式:GET /
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
签”开关。 图1 开启或关闭指标配置开关 关闭“指标采集开关”后,ICAgent会停止指标数据采集,相关指标数据不再更新,用户自定义指标还可以继续上报。 父主题: 配置管理
查看执法记录:页面左侧展示该方法的执行记录,包括:耗时明细、调用来源以及方法源码。 耗时明细展示调用方法、耗时时间并支持“下钻”操作。 单击操作列的“下钻”,可以查看此调用方法的详细信息。 查看默认观测项目:页面右侧展示默认观测项目,包括:Parameters、Return Object、Thrown