检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
查询绑定在节点上的资源列表 功能介绍 该接口用于查询绑定在节点上的资源列表。 调用方法 请参见如何调用API。 URI POST /v1/resource/{rf_resource_type}/type/{type}/ci-relationships 表1 路径参数 参数 是否必选
订阅AOM指标或告警数据 AOM支持用户订阅指标或者告警信息。订阅后可以将数据转发到用户配置的DMS或Webhook的Topic中,供消费者消费转发订阅的信息。 约束与限制 最多可创建10个数据订阅规则。 Webhook订阅类型当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
Prometheus实例id。 prom_type String Prometheus实例类型(暂时不支持VPC、KUBERNETES)。 枚举值: default ECS VPC CCE REMOTE_WRITE KUBERNETES CLOUD_SERVICE ACROSS_ACCOUNT prom_version
管理指标接入和日志接入 在接入中心完成指标接入AOM以及日志接入LTS后,您可以在接入管理页面管理相关的指标接入规则和日志接入规则。 约束与限制 接入管理功能区分新旧版,如果您进入的是旧版接入管理页面,需使用新版接入管理功能,可在“接入中心”页面右上角单击“体验新版”,切换为新版
开通AOM 1.0 开通AOM 1.0前请先注册华为账号并完成实名认证。 AOM 1.0即将下线,推荐使用AOM 2.0。 开通AOM 1.0 开通AOM时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需切换区域后分别进行开通操作。 操作步骤如下:
APM配置 AOM作为华为云服务可观测性分析统一入口,自身并不具有应用性能管理服务的功能,AOM 2.0控制台中APM配置相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
ope时checkMode填equals,checkContent格式为节点ID数组["hostId1","hostId2"],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 isDefaultRule String 是否为默认规则。 true、false
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
创建AOM告警静默规则 告警静默规则功能可以在指定时间段屏蔽告警通知。 约束与限制 您最多可创建100条静默规则,如果静默规则数量已达上限100时,请删除不需要的静默规则。 静默规则一旦创建完成,即刻生效。 创建告警静默规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
按命名空间接入:将所选命名空间的全部日志接入到指定的日志流。 规则名称:自定义规则名称,只支持输入英文字母、数字、中划线、下划线以及小数点。 选择集群:在下拉框中选择已有集群。 命名空间:在下拉框中选择已有命名空间。 工作负载:默认为“全部”,不可更改。 容器:在下拉框中选择已有容器。
添加阈值规则(即将下线) 功能介绍 该接口用于添加一条阈值规则,包括如下工作。 URI POST /v1/{project_id}/ams/alarms 替换接口请参考添加阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9150/metrics curl http://{集群任意节点私有IP}:30122/metrics 访问地址:http://{集群任意节点的公网IP}:30122/metrics。
查看组件外部调用监控项 外部调用是对当前应用调用的外部服务进行监控,包括CSEConsumer集群监控、ApacheHttpClient连接池、ApacheHttpAsyncClient连接池、DubboConsumer监控、HttpClient监控、NodeJsHttpClie
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规