检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
阈值规则:对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。同时执行自定义的触发策略,当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,会以邮件或
适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。 表1 计费项说明 计费项 计费说明 自定义指标上报量 自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几
nt Thin pool 元数据空间使用率 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) aom_host_diskpartition_thinpool_data_percent Thin pool 数据空间使用率 该指标用于统计CC
少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。
日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。 优势 应用自动发现:自
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
日志类型对应的版本。 在“实例名称”和“异常日志”下列表中选择实例与异常日志,可以查看该实例在对应采集器下的应用异常监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
在下拉列表中选择想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote
自建中间件接入AOM 卡片 相关操作 MySQL 关系型数据库,稳定高效,支持大量数据,广泛应用于网站和应用开发。具体操作请参见: MySQL日志接入(LTS) MySQL指标接入(AOM) Redis 内存数据结构存储系统,支持多种类型,用作数据库、缓存和消息代理。具体操作请参见: Redis日志接入(LTS)
IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1/query_range aom:metric:list √ √ 区间数据查询 POST /v1/{project_id}/aom/api/v1/query_range
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 2021-10-20 支持创建告警行动策略。关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。