检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指标总览 简介 基础指标:虚机指标 基础指标:容器指标 基础指标:Modelarts指标 基础指标:IEF指标 基础指标:CSE指标 基础指标:IoTDA指标 基础指标:node-exporter指标 基础指标:Flink指标 指标维度
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
及小数点。 选择集群:在下拉框中选择已有集群。 命名空间:在下拉框中选择已有命名空间。 工作负载:默认为“全部”,不可更改。 容器:在下拉框中选择已有容器。 选择接入规则。当下拉框中没有可用的日志组或日志流时,需要单击“添加日志组”、“添加日志流”创建。创建日志流后,需选择所属的企业项目。
定位代码级的性能问题。 相关配置请参见数据库查看组件数据库监控项。 Web容器 Web容器监控项可以对Web容器的访问进行监控,可以监控的Web容器包含Tomcat类型。 相关配置请参见查看组件Web容器监控项。 消息队列 消息队列监控项可以对消息队列的访问进行监控,可以监控的消
自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间 指标命名空间是对一组资源和对象产生的
查看。 普罗语句查询举例说明 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率 定义变量: pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes node内存实际总量:aom_no
(推荐)POST方法查询区间数据 功能介绍 该接口使用POST方法查询PromQL(Prometheus Query Language)在一段时间返回内的计算结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/query_range
标,即有新指标上报后,旧指标上报将会失败。 应用指标 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“ICAgent停止采集应用指标”告警(告警ID:34105)。 每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采
查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项 查看组件Web容器监控项 查看组件消息队列监控项 查看组件远程过程调用监控项 查看组件日志监控项 查看组件基础设施监控项 查看组件调用链监控项 父主题: 应用监控
安装采集管理器Uniagent。 CCE容器场景自建中间件接入AOM实现指标监控 Prometheus监控服务提供了多种常用中间件Exporter,由于AOM兼容原生Prometheus,您可以通过安装社区中的Exporter,将CCE容器场景自建中间件接入AOM。 第三方云厂商
全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。 资源监控使用说明 告警管理 A
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见日志管理使用说明。
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的AOM管理事件列表,请参见审计。 图1 云审计服务 日志 AOM支持采集容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,并展现在AOM界面中供用户搜索和查看,详细介绍请参见搜索日志。
metric_threshold Float 阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
ELB、云专线 DC、虚拟专用网络 VPN、NAT网关 NAT、企业路由器 ER、分布式消息服务 DMS、分布式缓存 DCS、专享版API网关 APIG、云数据库 GaussDB(for MySQL)、云数据库 GeminiDB、关系型数据库 RDS、文档数据库服务 DDS、数据复制服务
景,并选择需要存储的普罗实例。 组件与Prometheus实例建立关联之后,在组件实例中可以对容器资源或虚机资源进行观测。 图6 组件与基础设施关联分析设置 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus
gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 容器状态 aom_container_status status 容器状态 该指标用于统计容器的状态。 ≥0 无 进程指标 CPU aom_process_cpu_usage cpuUsage
metric_threshold Float 阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String 扩缩容:含有k8s的表示容器应用,含有vm的表示进程应用 parameters 参见表7 包含扩缩容的实例数 表7 parameters字段数据结构说明 参数名称 参数类型
产品规格差异 应用运维管理服务(简称AOM)按计费方式不同分为基础版、按需版两种,其中按需版又分为专业版和企业版。 各版本的具体规格差异请参见表1。 表1 版本规格差异说明 规格项 基础版 专业版 企业版 日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB