检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在右上角的搜索框中输入关键字,单击后在下面任务列表显示匹配对象。 隐藏/显示任务列表的列信息 单击,根据需要勾选/取消勾选对应列,可在任务列表中显示/隐藏该列。 刷新任务列表 单击,可刷新任务列表。 父主题: 运维管理
系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver、obs-driver
系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver, obs-driver
授权AOM访问其他云服务 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM 2.0服务生效
“RDS” “EVS” “CCE” “LTS” “AOM” monitor_objects Array of Map<String,String> objects 监控对象列表。
该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
图1 以CSV格式导出日志 图2 以TXT格式导出日志 (可选)单击“配置转储”,将搜索到的日志一次性转储到OBS桶的同一个.log日志文件中。具体操作详见添加一次性转储。 父主题: 日志管理(旧版)
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源
Kafka Exporter接入AOM实现指标监控 应用场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka
配置AOM全局开关 AOM支持配置如下全局开关: 指标采集开关:用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 告警消息内容显示资源的TMS标签:用来控制告警通知的消息内容是否显示不同云资源的标签。 约束与限制 全局开关针对整个AOM 2.0服务生效。 开启“告警消息内容显示资源的
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM已在统一身份认证服务
指标配置 “指标采集开关”用来控制是否对指标数据进行采集(自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态
使用Prometheus监控ECS主机的指标(新版) 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态
≥0 个 应用网关 envoy cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) envoy_http_downstream_cx_active 活跃连接总数 该指标用于统计活跃连接数。
响应参数 状态码: 200 表6 响应Body参数 参数 参数类型 描述 series Array of SeriesQueryItemResult objects 时间序列对象列表。
最多允许传入 50组维度数据,单个维度为json对象。 namespace 是 String 指标命名空间。如果想使用已有的命名空间,可通过调用查询标签值接口获取指标指标命名空间。
数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Oracle
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控