检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对
登录AOM 2.0控制台。 在左侧导航栏中选择以下两个入口: 入口一:选择“接入中心”,在“业务层”类型中单击“业务监控(基于日志)”指标卡片。 入口二:选择“业务监控(BETA) > 业务指标”,单击页面右上角“指标接入”按钮。 配置日志的基本信息。具体的参数说明如表5所示。 表5
的入口。通过业务层卡片的“接入日志(LTS)简介”链接,查看业务层日志接入LTS的相关操作文档。您可以根据文档完成日志接入LTS相关操作。 接入调用链(APM):AOM提供业务层的调用链接入APM的入口。通过业务层卡片的“接入调用链(APM)”链接,可快速接入业务层调用链。 接入
crontab for root”。 图1 安装ICAgent 可能原因 安装ICAgent的脚本会同时安装crontab计划任务,该提示信息表示当前没有root的计划任务。 解决方法 无需解决。 只要系统回显信息包含“ICAgent install success”,即表示ICAge
应用监控 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。通过应用监控您可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 功能介绍 应用监控基于应用资源管理对资源实行从应用、业务组件、到环境的分层监控,每一层对应的观测指标均不同。 应用层监控
“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。 在配置完应用发现之后,可以使用AOM监控应用的各项指标,关联应用对应的资源告警等,主要特性与场景如下:
、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 图1 AOM产品结构图 托管&运行态 AOM可无缝对接多个上层运维服务,支持快速从应
创建应用 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。创建应用后,即可为该应用添加子应用、组件等信息,并可通过应用监控等功能实时监控业务的运行情况。 创建应用 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。
维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 给企业中不同职能部门的员工创建IAM用户,还可以根据企业用户的职能设置不同的访问权限。
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境 用于区分一个组件的不同环境或者一个组件的多个部署区域。一个组件或者程序,由于部署不同的配置参数
兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。 创建分组规则:
随着上云企业越来越多,企业对用云成本问题也越发重视。使用AOM时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用AOM时,成本主要包括两个方面:
、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。 当前运维可观测大屏预置了基础版的业务指标监控大屏模板。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制 如果需要在AOM控制台
能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现IT对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产调优。 控制台说明 表1 AOM控制台说明
日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制
插件脚本,AOM就可以对相应的中间件及自定义插件指标进行监控,结合开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 为了快速了解并进行中间件及自定义插件接入AOM服务,建议您按照如下步骤进行操作: 给虚机安装采集器底座Uni
UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet
体化监控解决方案,为业务健康和稳定保驾护航。 本入门以业务指标监控大屏为例,向您介绍如何将AOM中的监控数据呈现在大屏页面中,以及如何对页面进行二次开发。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制