检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建静态阈值模板 使用模板创建阈值规则前需要先创建一个静态阈值模板。 注意事项 您最多可创建50个静态阈值模板,如果静态阈值模板数量已达上限50个时,请删除不需要的静态阈值模板后重新创建。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”。 在“静态阈值模板”页签下
快速分析日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常
添加日志转储 AOM支持将日志转储到对象存储服务(Object Storage Service,简称OBS)的OBS桶中,以便进行长期存储。如果您有更长时间的日志存储需求,可添加日志转储。 AOM提供周期性转储和一次性转储两种转储方式,供您选择使用。 周期性转储:将当前日志实时转储到
其他组件接入 操作场景 您可以使用自定义Exporter创建采集任务,可以监控该组件的相关指标,并通过Exporter上报数据库指标,用于异常报警和Grafana监控大盘展示。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤
创建通知规则 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员
工作负载监控 工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程
调用链 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。 图1 查看调用链 在查询条件下输入查询条件查询具体的调用链列表,详细请参见表1
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网
故障传播链分析 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 功能入口 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面
弹性云服务器ECS接入 Node Exporter是Prometheus的开源指标数据收集插件,负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。通过接入弹性云服务器ECS,您可以为主机组安装Node Exporter并配置采集任务,采集到的指标会存储在
通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务
Web监控 AOM作为华为云服务可观测性分析统一入口,自身并不具有APM服务的功能,AOM 2.0控制台中Web监控相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 Web监控功能当前仅在华东-上海一区域开放。 表1 功能说明
工具市场 工具市场会按照场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:脚本管理、文件管理。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
MySQL组件接入 操作场景 您可以直接使用AOM内置的MySQL插件来创建采集任务,通过快捷安装配置MySQL插件,就可以监控MySQL相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台
Redis组件接入 操作场景 您可以直接使用AOM内置的Redis插件来创建采集任务,通过快捷安装配置Redis插件,就可以监控Redis相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0控制台
Consul组件接入 操作场景 您可以直接使用AOM内置的Consul插件来创建采集任务,通过快捷安装配置Consul插件,就可以监控Consul相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2.0
Elasticsearch组件接入 操作场景 您可以直接使用AOM内置的Elasticsearch插件来创建采集任务,通过快捷安装配置Elasticsearch插件,就可以监控Elasticsearch相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS