检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警”
用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层
√ 瞬时数据查询 GET /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 瞬时数据查询 POST /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 查询标签值 GET
云上操作后,1分钟内可以通过云审计控制台查询管理类事件操作记录,5分钟后才可通过云审计控制台查询数据类事件操作记录。 CTS新版事件列表不显示数据类审计事件,您需要在旧版事件列表查看数据类审计事件。 在新版事件列表查看审计事件 登录管理控制台。 单击左上角,选择“管理与监管 > 云审计服务
ER、分布式消息服务 DMS、分布式缓存 DCS、专享版API网关 APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务 DRS、AI平台 ModelArts、湖仓构建 LakeFormation、表格存储服务
应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选)
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
单击“基础设施”,切换至基础设施页签,页面展示该组件基础设施指标详情。 图1 查看基础设施 在下拉列表中选择您想要查看的APM实例,可以查看该实例下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
查看应用性能指标 应用概览页面展示应用维度的指标数据,包含url调用次数、url平均响应时间、url错误率等;同时支持“购买特惠包”以及“接入应用”。 查看应用性能指标 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请
不支持(默认可存储3个月)。 支持(最长367天)。 数据导出 支持导出近3个月聚合数据。 支持导出近48个小时原始数据。 支持仪表盘、API导出。 支持数据写入kafka。 聚合查询 不支持聚合查询,仅支持简单查询。 支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法
可设置为31天。 设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。
write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM支持以下原生Prometheus的API: 查询普罗(Prometheus)接口URL:
AOM可以查看映射前后所有的日志数据,日志流A不会复制或移动原AOM日志流中的历史数据,如图2所示。 图2 已创建映射 修改映射 如果您需要修改映射,如:将映射规则从日志流A变更为日志流B,最新的日志将上报至日志流B,AOM可以查询AOM日志流和日志流B的内容,无法查看日志流A的内容,如图3所示。
AOM可以查看映射前后所有的日志数据,日志流A不会复制或移动原AOM日志流中的历史数据,如图2所示。 图2 已创建映射 修改映射 如果您需要修改映射,如:将映射规则从日志流A变更为日志流B,最新的日志将上报至日志流B,AOM可以查询AOM日志流和日志流B的内容,无法查看日志流A的内容,如图3所示。
了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。
%&'+;<=>?\ 数据来源 单击“指标源”选择指标数据作为数据来源。 图表类型 指标图表可选择的图表类型,包括:折线图、数字图、TopN、表格、柱状图、数字折线图。 添加方式 按照需要添加指标数据。添加指标数据的方式有两种:全量指标、按普罗语句添加。 全量指标 指标下拉框中展示全部指标数据,可按需选取指标。
面还可查看相关的日志和告警。 应用管理与运维平台 应用管理与运维平台(ServiceStage)是面向企业的一站式PaaS平台服务,提供应用云上托管解决方案,帮助企业简化部署、监控、运维和治理等应用生命周期管理问题;提供微服务框架,兼容主流开源生态,不绑定特定开发框架和平台,帮助
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。