检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现
中划线和点组成。 应用名称 应用的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 企业项目 华为云企业项目,请从下列列表中选择。 如果现有的项目无法满足需求,可单击“创建项目”添加。 描述 应用的描述信息,最多可输入255个字符。 设置完成后,单击“确认”。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运
该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 SAP 监控 随着越来越多的SAP系统上云,SAP云上应用监控也被大家日渐关心,由于SAP系统都是企业内的核心业务系统,仅仅IAAS监控难再满足业务的需求,IT运维也日渐趋向于以应用为中
远程存储 自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。 云产品监控 无缝集成了多种云产品的监控数据。用户如果有云产品的监控需求,可以通过接入云产品监控实施。 指标 采集目标暴露的、可以完整反映监控对象运行或者业务状态的一系列标签化
无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效。 前提条件
自建Prometheus数据上报到AOM 在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签,可以获取当前Prometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM
“指标采集开关”用来控制是否对指标数据进行采集(自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 指标配置”。
“指标采集开关”用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。该权限设置针对整个AOM 2.0服务生效。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,
Prometheus对于运维人力有限的中小型企业而言,成本太高。对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云上托管Prometheus已成为越来越多上云企业的第一选择。 解决方案 AOM全面对接开源Prometheus生态,将容器服务Kubernetes集群接入Prom
监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警
括未绑定应用的云资源,便于用户对资源进行分析和管理。 目前支持对以下资源类型的管理: 云服务器ECS、云容器引擎CCE,数据库(关系型数据库RDS、文档数据库DDS、数据复制服务DRS、云数据库GaussDB NoSQL、云数据库 GaussDB),网络(虚拟私有云VPC、弹性负载均衡器ELB、弹性公网IP
知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。 解决方案 AOM能够实现云上应用的一站式立体化运维管理,在接入中心中可以接入需要监控的业务层、应用层、中间件层、基础设施层指标,在仪表盘中实现个性化监控,以及通过统一
告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。 优势 体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。 故障快速诊
支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法 不支持 支持,告警规则、仪表盘、指标浏览等监控功能均支持。 仪表盘 支持标准云产品的单实例大盘。 提供丰富的预置模板。 仪表盘支持的图表类型 2 8+ 仪表盘支持的监控视图数 50 100+ 创建告警规则数 仅支持1000。
到对象存储服务(OBS)或云日志服务(LTS),才可在OBS桶或LTS日志组里面查看历史事件信息。否则,您将无法追溯7天以前的操作记录。 云上操作后,1分钟内可以通过云审计控制台查询管理类事件操作记录,5分钟后才可通过云审计控制台查询数据类事件操作记录。 在新版事件列表查看审计事件