检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
题。 AOM帮您解决 图2 一站式运维平台 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
口,实时监控并展示重点资源或应用数据。 接入中心 通过接入中心可快速接入需要监控的多场景、多层次、多维度指标数据,接入完成后,即可方便地在“指标浏览”等页面查看相关资源或应用的运行状态、各个指标的使用情况等信息。 仪表盘 通过仪表盘可将不同资源数据图表展示到同一个屏幕上,通过不同
如何将Prometheus数据接入到AOM? 将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见: Prometheus实例 for ECS Prometheus实例 for CCE Prometheus
录: 在新版事件列表查看审计事件 在旧版事件列表查看审计事件 使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列表页面去查看,或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控
录: 在新版事件列表查看审计事件 在旧版事件列表查看审计事件 使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列表页面去查看,或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控
Rule)可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算,导致查询端压力过大,通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 前提条件
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息请参见Prometheus官方文档。 Prometheus实例 Prometheus实例是AOM服务提供的管理Prometheus数据采集和数据存储分析的逻辑单元。根据Promet
方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应
时间范围和统计周期的关系 AOM约束单个指标单次查询最大返回1440个数据点,因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。
磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes) 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 表2 磁盘指标维度 维度 说明
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层
参考表1设置指标参数信息,查看页面上方的指标图表,多角度对指标数据进行分析。 表1 指标参数说明 参数 说明 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 说明: 样本个数为指标数据点的计数。 统计周期 指标数据按照所设置的统计周期进行聚合。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
Write地址,将自建Prometheus的监控数据存储到AOM的Prometheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 当前仅Prometheus
√ 瞬时数据查询 GET /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 瞬时数据查询 POST /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 查询标签值 GET