检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接入AOM(新版) 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 组件层接入AOM 中间件接入AOM 运行环境接入AOM 云服务接入AOM API开源协议及其他组件接入AOM 管理指标接入和日志接入
创建告警规则(按Prometheus命令创建) 04:08 创建告警规则(按Prometheus命令创建) 应用运维管理 AOM 通过虚机接入方式接入中间件指标 03:54 通过虚机接入方式接入中间件指标
Prometheus实例id。 prom_type String Prometheus实例类型(暂时不支持VPC、KUBERNETES)。 枚举值: default ECS VPC CCE REMOTE_WRITE KUBERNETES CLOUD_SERVICE ACROSS_ACCOUNT prom_version
内存占用和告警状态等信息,您可直观了解每个组件的运行状态。单击组件名称,可了解更多组件状态。AOM支持从组件下钻到实例,从实例下钻到容器。通过各层状态,您可完成对组件的立体监控。 在左侧导航栏中选择“监控 > 组件监控”,查看组件列表。 组件列表中对组件名称、状态、所属应用、部署方式、应用发现规则等参数进行展示。
eus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据 配置Remote Write地址实现自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据
配置参数库 “参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_
创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目标实例”时选择“全局参数”,并通过下拉框选择 param2,保存作业步骤即可生效。 作业创建完成后,可以在每次执行时填入 param1
场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
显示查询到的日志条数。 图1 通过柱状图查看统计数据 将鼠标移至矩形块,提示信息显示了该矩形块代表的时间范围(起始时间和结束时间)及该时间范围内满足查询条件的日志条数。单击矩形块(单击,可取消选中),日志列表会同步展示该矩形块相应的日志内容。 通过日志列表查看日志内容 日志列表中
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" , "key1" : "value1" // 创建告警规则时配置的告警标签
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
且不能以下划线开头,您最多可创建10个自定义标签。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 告警标注特征 告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。
http-metrics containerPort: 9187 获取指标。 通过“curl http://exporter:9187/metrics”无法获取Postgres实例运行时间,可以通过自定义一个queries.yaml来获取该指标。 创建一个包含queries.yaml的配置。
prom_type 否 String Prometheus实例类型(暂时不支持VPC、KUBERNETES)。 枚举值: default ECS VPC CCE REMOTE_WRITE KUBERNETES CLOUD_SERVICE ACROSS_ACCOUNT cce_cluster_enable
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP