检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。
应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制 如需使用“应用资源管理”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,
如何创建委托apm_admin_trust? 创建委托 登录IAM控制台。 在左侧导航栏,单击“委托”,进入委托页面。 单击右上角“创建委托”,进入创建委托页面。 参考表1设置创建委托的参数。 表1 创建委托 名称 说明 样例 委托名称 标识该委托代理的名称。
免费体验AOM服务 在华为云学院沙箱实验室,您可以免费体验AOM服务,完成电子商城网站应用的一站式运维。体验地址: 使用AOM实现云端应用一站式运维。
访问AOM 2.0 访问AOM时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需分别进行开通操作。有两种开通方式,可根据需要选择方式一和方式二。 约束与限制 开通AOM前请先注册华为账号并完成实名认证。 AOM 2.0当前在华北-乌兰察布-汽车一
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。
单击“确定”完成创建。 创建日志流 输入日志流名称。日志流名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 单击“确定”完成创建。
示例流程 图1 给用户授权AOM权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予AOM只读权限“AOM ReadOnlyAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。
表1 自建中间件接入AOM 卡片 相关操作 MySQL 关系型数据库,稳定高效,支持大量数据,广泛应用于网站和应用开发。具体操作请参见: MySQL日志接入(LTS) MySQL指标接入(AOM) Redis 内存数据结构存储系统,支持多种类型,用作数据库、缓存和消息代理。
配置指标告警规则:通过创建告警规则对ECS的指标设置告警阈值条件,当指标数据满足设置的告警阈值条件时产生告警。 准备工作 购买一台弹性云服务器,详细请参考快速购买和使用Linux ECS。如果您已有可用的弹性云服务器,可重复使用,不需要再次购买。 已开通AOM 2.0并授权。
图4 设置告警降噪方式 单击“立即创建”,完成创建。如下图所示,创建了一条事件类告警规则。 该规则监控对象为AOM服务的紧急告警事件,当服务事件满足已设的通知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。
开通AOM 1.0 开通AOM 1.0前请先注册华为账号并完成实名认证。 AOM 1.0即将下线,推荐使用AOM 2.0。 开通AOM 1.0 开通AOM时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需切换区域后分别进行开通操作。 操作步骤如下
单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。
设置完成后,单击“立即创建”,完成分组规则创建。 更多告警分组规则操作 分组规则创建完成后,您还可以执行表2中的相关操作。 表2 相关操作 操作 说明 编辑分组规则 单击“操作”列的“编辑”。 删除分组规则 删除单条规则:单击对应规则“操作”列的“删除”。
创建策略 功能说明 该接口用于创建策略。 策略名称必须为以0~9、a~z、A~Z、下划线(_)或中划线(-)组成的1~64位字符串,且必须以字母开头。
设置完成后,单击“立即创建”。抑制规则创建后,默认对所有分组后的告警生效。 更多抑制规则操作 抑制规则创建完成后,您还可以执行表2中的相关操作。 表2 相关操作 操作 说明 编辑抑制规则 单击“操作”列的“编辑”。 删除抑制规则 删除单条规则:单击对应规则“操作”列的“删除”。
查看告警详情 单击告警名称可查看告警详情,包括告警信息和修复建议,如果在创建告警规则时关联了告警行动规则(告警通知规则)或告警降噪规则,还可查看行动规则(通知规则)或告警降噪规则相关信息。
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。