检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件传播链路分析 事件传播链路分析基于调用链和平均RT、错误率等分析关键指标数据,找出异常在调用链追踪链路中的传播拓朴图,并展示完整的故障传播链,可以更有效地定位根因。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围:
日志类型对应的版本。 在“实例名称”和“异常日志”下列表中选择实例与异常日志,可以查看该实例在对应采集器下的应用异常监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。
在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。
加载指标数据,全面还原用户的体验感受,定位访问慢的原因。 定位应用性能瓶颈 业务痛点 随着业务不断发展,业务逻辑日益复杂,导致应用性能问题分析与定位日益艰难,给监控运维带来了巨大的挑战: 应用之间的依赖关系复杂,难以梳理。 调用链路长,排查和定位群体困难。 接口调用、数据库调用关系复杂,管理难度大。
适用计费项 按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。 表1 计费项说明 计费项 计费说明 自定义指标上报量 自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几
时间范围和统计周期的关系 AOM约束单个指标单次查询最大返回1440个数据点,因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。
在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。
分布式缓存服务(Distributed Cache Service,简称DCS)是一款内存数据库服务,兼容了Redis、Memcached和内存数据网格三种内存数据库引擎,为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,满足高并发及数据快速访问的业务诉求。 当您开通了DCS后,无需额外安装其他
Cache Service,简称DCS)是华为云提供的一款内存数据库服务,兼容了Redis、Memcached和内存数据网格三种内存数据库引擎,为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力,满足高并发及数据快速访问的业务诉求。 当您开通了DCS后,无需额外安装其他
en值为“ABCDEFJ....”,则调用接口时将“X-Auth-Token: ABCDEFJ....”加到请求消息头即可,如下所示。 POST https://iam.cn-north-4.myhuaweicloud.com/v3.0/OS-USER/users Content-Type:
永久移动,请求的资源已被永久的移动到新的URI,返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其它地址。 使用GET和POST请求查看。 304 Not Modified 所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。 305 Use Proxy 所请求的资源必须通过代理访问。
CCE实例可以上报多个CCE集群数据。 开源兼容 支持自定义多维数据模型、HTTP API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例
Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 时间序列 由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 远程存储 自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。 云产品监控 无缝集成了多种云产品的监控数据。用户
配置预聚合规则 指标管理 仪表盘监控 数据多写 配置指标存储时长 接入指南 获取Prometheus实例的服务地址 Prometheus实例读写地址支持公网的局点 通过Remote Read方式读取Prometheus实例数据 自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图
义别名和分组对资源进行管理。 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,数字图、TopN图表等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形
Thin pool 元数据空间使用率 (aom_host_diskpartition_thinpool_metadata_percent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_h
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”