检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标存储时长 AOM 2.0默认支持的指标存储时长为15天。15天内免费使用,超过15天则按量累计计费。 数据转储量 AOM支持的指标数据转储量。 计费周期 系统会在每日的固定时间统一结算前一天产生的按量费用,每日的13:00~22:00生成前一天账单并发送用户,并自动通过用户账户余额进行抵
析,也可对结构化后的日志进行SQL查询与分析。 注意事项 查看桶日志前需确保至少已创建了一个日志桶,否则无法查看桶日志。 最多可查看最近7天内的桶日志。 查看桶日志 登录AOM控制台,在左侧导航栏中选择“日志 > 日志桶”,在“桶日志”页签查看桶日志。 设置查询条件。 选择日志桶
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes)
实例指标及其维度 实例指标是由容器或进程指标汇聚而来的,其指标维度与容器或进程指标维度相同。 容器指标详见:容器组件指标及其维度 进程指标详见:虚机组件指标及其维度。 父主题: 指标总览
磁盘分区指标 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device
删除静默规则 功能介绍 删除静默规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
配置AOM全局开关 AOM支持配置如下全局开关: 指标采集开关:用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 告警消息内容显示资源的TMS标签:用来控制告警通知的消息内容是否显示不同云资源的标签。 约束与限制 全局开关针对整个AOM 2.0服务生效。 开启“告警
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
图1 日志文件详情 (可选)单击该实例“操作”列的“配置转储”,将该实例的日志一次性转储到OBS桶的同一个.log日志文件中。具体操作详见添加一次性转储。 父主题: 日志管理(旧版)
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
配额设置 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 登录AOM控制台。 选择“配置管理 > 配额设置”。 查看指标配额。 图1 查看配额 当指标超过配额时,时间较早的指标将会被删除。 父主题: 配置管理
常见计费问题 如何查看每天的自定指标上报量? AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2
查询监控数据 功能介绍 该接口用于查询指定时间范围内指标的监控数据,可以通过参数指定需要查询的数据维度,数据周期等。(该接口已不再演进,建议使用 (推荐)POST方法查询区间数据接口。) 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metricdata
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
AOM与APM同属于立体化运维解决方案体系,共享采集器。AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架
0时表示未删除。 timeout Long 告警自动清除时间。毫秒数,例如一分钟则填写为60000。默认清除时间为3天,对应数字为 4320 * 1000(即:3天 * 24小时 * 60分钟 * 1000毫秒)。 metadata Map<String,String> 事件或者
参数 参数类型 描述 compactor_blocks_retention_period String 指标存储时长,只支持 15天,30天,60天 ,90天 枚举值: "360h" "720h" "1440h" "2160h" 请求示例 查询Prometheus实例。 https:
</b> <span>新增 <span> 1 条运维通知 <span><span>,阈值规则为
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理