检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业项目,一个项目可以包含一个或者多个应用。 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 在菜单栏的“全部企业项目”的下拉列表中,选择企业项目。 图2 企业项目 父主题: 应用资源管理
运行环境”类型中单击需要接入的卡片,参考下表执行相关接入操作。 表1 Prometheus 运行环境接入AOM 卡片 相关操作 云容器引擎 CCE (ICAgent) 通过ICAgent插件采集CCE集群指标。云容器引擎CCE在购买后集群和节点后默认已经安装ICAgent,自动将CCE集群指标上报到AOM,用户无需手动接入。
产品功能 应用监控 应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。即在应用监控中,将应用、组件、
CCE容器场景自建中间件接入AOM方案概述 应用场景 Prometheus监控服务提供了多种常用中间件Exporter,由于AOM兼容原生Prometheus,您可以通过安装社区中的Exporter,将CCE容器场景自建中间件接入AOM。 常用中间件Exporter接入AOM 表1
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
查询指定告警行动规则详细信息 场景描述 本章以通过告警行动规则名称获取告警行动规则为例。 涉及的基本信息 通过告警行动规则名称获取告警行动规则之前,需要确定要获取的告警行动规则名称,该名称可通过“获取告警行动规则列表”接口查询,也可以通过在AOM 2.0console界面查询到的告警行动规则名称获取。
naming ip个数 微服务注册实例数。 ≥0 个 nacos_serviceSubscriberCount Nacos naming订阅者数量 Nacos naming订阅者数量。 ≥0 个 nacos_serviceCount Nacos naming域名个数(2.x 版本) Nacos集群内各节点的服务个数。
解决方案 AOM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。 基于应用拓扑自助发现,定位性能瓶颈。 真实还原应用大规模业务访问场景,帮助用户提前识别应用性能问题。 基于关键性能指标对比,优化应用性能。 根据指标变化趋势配置告警,及时了解异常。
"topology" : [ { "app_id" : "07f6836530e24efdab068aacef933d4b", "app_name" : "test91", "sub_app_id" : "b554711fb4774bf98cfbdfa955a2d640"
应用运维管理-成长地图 | 华为云 应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务
[ ], "success" : [ { "app" : "xxxxxx", "code" : "0", "matchLabels" : "{\"app\":\"xxxxx\",\"version\":\"xxxx\"}"
从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。 枚举值: application/json 响应参数 状态码: 400 表3 响应Body参数 参数 参数类型 描述 error_code
及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
通过IAM授予使用AOM的权限 创建用户并授权使用AOM AOM自定义策略
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。 Content-Type 是 String 指定类型为application/json。 Enterprise-Project-Id 是 String 企业项目id。 更新单个企业项目下实例,填写企业项目id。
如果需要在AOM控制台中使用CES的功能,需要提前获取CES的相关权限,详情请参见CES权限管理。 “云服务监控”功能当前仅华南-广州区域受限开放,如有需求可以通过提交工单,为您开放此功能。 AOM 2.0融合CES相关功能后,会向AOM FullAccess策略中添加“CES:*:*”,“ecs:i
从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。 枚举值: application/json enterprise-project-id 否 String 告警所属的企业项目id。获取方式请参见:获取企业项目ID。
任务执行成功时,发送通知给相关人,系统默认开关关闭。 通知人配置:在下拉列表中选择“通知人”,可以选择一个或者多个。 也可以通过“创建主题”的方式选择。通过选择“主题”的方式配置通知人,需要先通过“创建主题”创建一个新主题,并为这个主题添加订阅,之后即可通知。 执行失败通知 任务执行失败时,发送通知给相关人,系统默认开关关闭。