检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
阈值告警最佳实践(新版) 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
自动化运维 表1 自动化运维基本概念 术语 说明 脚本管理 支持Shell、Python、Bat、Powershell脚本语言以及单个脚本的多版本管理。 作业管理 将脚本和文件原子操作进行多步骤编排形成作业模板,用于完成特定运维自动化场景操作。例如初始化业务环境。 执行方案 从作
创建AOM应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警。 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
通过Grafana查看Prometheus实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志搜索”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。
与AOM 1.0对比 AOM 2.0基于AOM 1.0原有功能,结合用户常用的应用监控,增加了多种指标和日志数据的采集与监控,并对监控结果可视化呈现。同时,通过自动化运维功能将日常运维操作服务化、自动化,减少运维人员重复性操作。 本章节主要对比AOM 2.0与AOM 1.0版本的功能特性。
快速管理应用 本章节介绍在“总览”页面的应用视角下,如何通过AOM快速管理应用,包括应用创建到发现、监控等操作。主要操作如下: 创建应用:通过CMDB创建应用和资源关系树,在应用所在主机安装采集器。 配置告警:创建指标告警规则,应用异常时发送通知。 配置告警行动规则:配置告警处理策略,如应用异常时自动重启。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规
运行环境接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将弹性云服务器ECS、云容器引擎CCE等运行环境相关指标接入AOM,并支持查看运行环境日志接入LTS相关操作文档。 配置运行环境接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 >
配置多账号聚合实现指标统一监控 多账号聚合Prometheus实例类型,提供对同一组织下多个成员账号的云服务指标监控。 前提条件 已在组织控制台界面启用AOM 可信服务,具体操作请参见启用、禁用可信服务。 同一组织下多个成员账号均已接入云服务指标。 约束与限制 只有组织管理员或委
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。
将AOM仪表盘图表页面嵌入用户自建系统 AOM支持将仪表盘图表页面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至用户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。 应用场景 该功能主要用于用户可
创建AOM告警行动规则(告警通知规则) AOM提供告警行动规则(告警通知规则)定制功能,您可以通过创建告警行动规则(告警通知规则)关联SMN主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 前提条件 已创建一个主题,操作详见创建主题。
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
修改ECS非管理员密码 使用修改ECS非管理员密码卡片可以修改非管理员用户的密码。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
数据订阅 AOM支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 数据订阅功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 最多可创建10个数据订阅规则。 创建订阅规则 在左侧导航栏中选择“配置管理
查看AOM告警或事件 “告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。