检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建AOM告警静默规则 告警静默规则功能可以在指定时间段屏蔽告警通知。 约束与限制 您最多可创建100条静默规则,如果静默规则数量已达上限100时,请删除不需要的静默规则。 静默规则一旦创建完成,即刻生效。 创建告警静默规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
AOM配置日志转储时无法选中obs桶是什么原因? 问题描述 账号有OBS的权限,但在日志转储下无法查看OBS桶列表,报错码:LTS.0203。 可能原因 用户未给该子账号添加LTS权限。 解决方法 登录管理员账号,进入统一身份认证服务控制台。 在用户页面,找到需要添加LTS权限的用户名,单击右侧操作列的“授权”。
如何在VPCEP控制台为AOM/LTS创建终端节点? 当前支持通过创建终端节点和AOM/LTS服务打通网络,进行心跳和指标上报,以及日志上报。如果要通过终端节点的方式打通AOM/LTS的网络,需要为AOM和LTS各自购买1个终端节点。 创建AOM/LTS终端节点的方法: 登录华为
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
添加阈值 该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 AOM已对接消息通知服务(Simple Message
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
查看组件通信协议监控项 通信协议监控项可以对通信协议的访问进行监控,可以监控的通信协议包含Websocket类型。 查看组件通信协议 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
创建AOM告警抑制规则 告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则
Memcached Exporter接入AOM实现指标监控 应用场景 使用Memcached过程中需要对Memcached运行状态进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Export
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
ElasticSearch Exporter接入AOM实现指标监控 应用场景 使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Elasti
设置日志配额 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”。 在“配额设置”页签下可以查看您当前使用日志大小、存储时长。 如果在AOM中已创建日志接入LTS规则,则实际的日志存储时长以LTS中“日志管理”界面设置的“日志存储时间(天)”为准,“配置设置”界面的“日志存储时长”不生效。
Redis Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小