检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
云审计服务支持的AOM操作列表 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker
查看AOM审计事件 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kuber
仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
查看组件基础设施监控项 基础设施功能支持通过仪表盘图表展示APM实例下的性能指标数据。例如,折线图、数字图等,帮助用户全面、深入地掌握应用性能监控数据。 约束与限制 需要提前在组件设置中配置组件与基础设施关联分析设置后,组件详情页面才会展示基础设施页签。 查看组件基础设施 登录AOM
停止计费 对于以按需计费模式使用的AOM 2.0资源,相关指标和日志数据从上报之日起,在AOM 2.0上会自动存储一个月,一个月后系统自动删除数据,删除后相关数据将停止计费。如果用户需要继续使用相关指标和日志数据,建议采用以下方式存储: 日志数据:通过日志转储功能,将日志数据转储
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。
云服务接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将云服务相关指标接入AOM、将云服务相关日志接入LTS以及查看云服务日志接入LTS相关操作文档。 前提条件 已接入通用实例类型Prometheus监控,详情请参见创建Prometheus 通用实例。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
添加阈值 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
业务层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持监控ELB日志指标、APM事务监控指标等,例如用户数、订单数。 配置业务层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果您进入的是新版接入中心
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
云服务接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持云服务接入AOM。即可将云服务关指标上报到AOM。例如:CPU使用率、内存使用率等。 为了快速了解并进行云服务接入AOM服务,建议您按照如下步骤进行操作: 创建云服务类型Prometheus实例。通过关
业务层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将Web&H5、Android,IOS APP、支付宝、钉钉、百度等业务层小程序调用链接入APM,支持查看业务层小程序日志接入LTS相关操作文档,以及支持将LTS的日志数据提取为指标接入到AOM进行统一管理。
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。指标分为系统指标和自定义指标。 系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS