检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
查看AOM审计事件 AOM为运维人员提供一站式立体运维平台,实时监控应用、资源运行状态,通过数十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kuber
TURBO,SMN,VPN,GeminiDB,AS,CloudTable,MRS,CBH,ER,GaussDB for MySQL,DCS,RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,DC,CSS,EVS,CBR,APIG)以及
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
为云服务新增告警规则 云服务名称 告警规则类型 新增方式 FunctionGraph、DRS、RDS、NAT、VPC、DCS、CSS、DC、CBR、DMS、ELB、EVS、OBS、DDS、WAF 指标告警规则 单击“新增阈值告警规则”。 在弹出的“创建规则”对话框中设置规则名称、指标数据和告警条件等
概述 AOM日志接入LTS功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志
日志接入LTS概述 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 约束与限制 AOM日志接入LTS功
PostgreSQL Exporter接入AOM实现指标监控 应用场景 使用PostgreSQL过程中需要对PostgreSQL运行状态进行监控,以便了解PostgreSQL服务是否运行正常,及时排查PostgreSQL故障问题原因。Prometheus监控服务提供了CCE容器场
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
日志接入 可以将应用资源管理中主机待采集日志的路径配置到日志流中,ICAgent将按照日志采集规则采集日志,并将多条日志进行打包,以日志流为单位发往AOM,您可以在AOM控制台实时查看日志。 前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
应用层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。例如:请求平均时延、错误调用次数、请求吞吐量等。 配置应用层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 >
云服务、开源监控系统、Prometheus API/SDK接入和Prometheus 自定义插件接入的指标。 日志数据 请参见添加日志图表 监控业务指标或其他日志指标,如基于ELB日志清洗出来的接口黄金指标(时延、吞吐和错误)。 添加指标图表。参考表3设置相关参数,设置完成后单击“保存”。 图1 添加指标图表 表3 添加指标图表
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
权限管理 如果您需要对AOM资源给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制AOM资源的访问。
概述 应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障
运行环境接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心功能,支持将弹性云服务器ECS、云容器引擎CCE等运行环境相关指标接入AOM,并支持查看运行环境日志接入LTS相关操作文档。 配置运行环境接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 >
Prometheus监控概述 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQ
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
约束与限制 应用资源管理使用限制 表1 应用资源管理使用限制 限制项 说明 应用数量 租户创建的应用个数最多不超过1000。 子应用数量 应用下创建的子应用数量最多不超过50。 组件数量 子应用下的创建的组件数量最多不超过50。 环境数量 组件下可创建的环境数量最多不超过20。 资源数量