检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
管理访问凭证 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。每个用户只能创建一个凭证。 新建凭证 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > 访问凭证”,进入访问凭证页面。 单击“同意授权”。
管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote
标-虚机指标。 如需通过Prometheus采集CCE集群指标数据上报到AOM,具体操作请参见使用Prometheus监控CCE集群指标。 云容器实例 CCI 云容器实例CCI服务默认自动将指标上报到AOM,其指标数据开箱即用。用户无需手动接入。 单击“云容器实例 CCI”卡片,
用码。一般情况下,应用码的值与业务code的正确值相同。配置url监控项详见:配置url监控项。 选填 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为1天。 单击“调用链”,进入调用链详情页面。
费,按照云服务器实际使用时长计费。关于按需计费模式的详细介绍请参见计费模式概述。 计费项 AOM的计费项由自定义指标上报量、指标存储时长、数据转储量的费用组成。了解每种计费项的计费因子、计费公式等信息,请参见计费项。 费用账单 您可以在“费用中心 > 账单管理”查看与AOM相关的
进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。 可在左侧导航栏中选择“告警管理(告警中心) > 告警列表”,在“告警”页签下查看该告警,具体请参见“查看告警”。 查看事件 在已设的连续周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。 可在左侧导航栏中选择“告警管理(告警中心)
资源状态变为“已冻结”,您将无法对处于保留期的按需计费资源执行任何操作。 保留期到期后,若您仍未支付账户欠款,那么所使用资源都将被释放,数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。 图1 按需计费AOM资源生命周期 避免和处理欠费 欠费后需要及时充值,详细操作请参见账户充值。
日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 输入命令验证Memcached Exporter是否部署成功,有指标数据返回则表示Memcached Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http
方案id。 最小长度:1 最大长度:64 表2 Query参数 参数 是否必选 参数类型 描述 share_type 是 String 模板共享类型,默认为private。可选public private 最小长度:1 最大长度:10 请求参数 表3 请求Header参数 参数 是否必选
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天 50万条/月,存储时长30天
IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1/query_range aom:metric:list √ √ 区间数据查询 POST /v1/{project_id}/aom/api/v1/query_range
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
每页查询数量,默认20。每页最多支持查询100条数据。 ecs_id_list 否 Array of strings ecs ID列表信息。最多支持传入100条数据。 agent_id_list 否 Array of strings agent ID列表信息。最多支持传入100条数据。 coc_cmdb_id_list
diskReadRate 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_node_disk_write_kilobytes diskWriteRate 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) GPU aom_n
Query参数 参数 是否必选 参数类型 描述 type 否 String 指标查询方式。 limit 否 String 用于限制本次返回的结果数据条数。 取值范围(0,1000],默认值为1000。 最小长度:0 最大长度:4 start 否 String 分页查询起始位置,为非负整数。
日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图1 查看日志 输入命令验证Kafka Exporter是否部署成功,有指标数据返回则表示Kafka Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9308/metrics
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_h
参数 参数类型 描述 no_data_timeframe Integer 无数据周期的个数。 no_data_alert_state String 数据不足时,阈值规则的状态。 “no_data”:数据不足并发送通知 “alerting”:告警 “ok”:正常 “pre_state”:保持上一个状态