检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装ICAgent(华为云主机) ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装,您不用安装ICAgent。 安装前提 在进行ICAgent安装前,需要先
概述 AOM提供告警行动规则定制功能,当资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。
配置AOM全局开关 AOM支持配置如下全局开关: 指标采集开关:用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 告警消息内容显示资源的TMS标签:用来控制告警通知的消息内容是否显示不同云资源的标签。 约束与限制 全局开关针对整个AOM 2.0服务生效。 开启“告警
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。
管理APM探针启停状态 APM探针(Agent)通过字节码增强技术进行调用埋点,可运行在应用所在的服务器上,实时采集应用性能相关的数据。您可以管理APM探针启停状态。 管理APM探针启停状态。 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 探针管理”,进入探针管理页面。
通过AOM监控云服务 云服务监控页面以曲线图、数字图等形式直观展示华为云各服务实例的运行状态、各个指标的使用情况等信息。当前支持在的云服务监控页面查看监控信息的云服务,包括:函数工作流 FunctionGraph、对象存储服务 OBS、弹性公网IP和带宽、弹性负载均衡 ELB、NAT网关
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
创建静态阈值模板 使用模板创建阈值规则前需要先创建一个静态阈值模板。 注意事项 您最多可创建50个静态阈值模板,如果静态阈值模板数量已达上限50个时,请删除不需要的静态阈值模板后重新创建。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”。 在“静态阈值模板”页签下,单击“创建静态阈值模板”。
管理日志接入LTS规则 AOM支持本章为您介绍如何管理日志接入LTS规则,支持添加、查看、删除日志接入LTS的规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
业务层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持监控ELB日志指标、APM事务监控指标等,例如用户数、订单数。 配置业务层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果您进入的是新版接入中心
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
查看桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 目前对于华北-北京一、华东-上海二和华南-广州区域,桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。