检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据需要修改对应接入云服务、接入CCE集群、接入账号信息。 删除Prometheus实例 选择待删除的Prometheus实例,在“操作”列中单击。 说明: 删除CCE类型Prometheus实例时,若实例已接入CCE集群,确定删除后,集群指标将无法托管至此实例。 查看Prometheus实例计费状态
来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数
维度 说明 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。
行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。 安装方式见表1: 表1 安装方式 方式 适用场景 首次安装 当满足以下条件时,您需要按照该方式安装:
ICAgent版本说明 表1 ICAgent版本说明 版本号 说明 5.12.135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。
默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。 适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。 Prometheus实例 for ECS ECS 通过在VPC内的某台虚机上安装uniagent(
来。例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数
基于CMDB模型,从应用、组件到环境对资源健康状态分层监控。 部分支持 不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标
nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。 ≥0 次 nacos_longPolling Nacos
体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。 故障快速诊断:分布式调用追踪,快速找到异常故障点。 资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标,集群->虚机->应用->容器异常关联分析。 图2 立体化运维
系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。
系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。 PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。
Prometheus实例、卸载托管Prometheus实例等接口。 配置管理 配置相关API,包括查询aom2.0相关云服务授权信息和查询集群主机安装的ICAgent信息接口。 UniAgent管理 UniAgent相关API,包括下发批量安装,升级UniAgent任务,以及查询UniAgent主机列表接口。
原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish
说明 示例 转储文件形式 包括自定义文件和日志桶。 自定义文件 转储方式 包括一次性转储和周期性转储。 周期性转储 筛选条件 可按照日志类型、集群名称、命名空间等多个维度对日志进行筛选,以便将满足条件的日志进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日
11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 ≥0 兆字节(MB) aom_container_filesystem_capacity_megabytes 文件系统容量 该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。
关参数后,单击“确定”。 表1 周期性转储参数说明 参数 说明 示例 转储方式 请选择周期性转储。 周期性转储 筛选条件 可按照日志类型、集群名称、命名空间等多个维度对日志进行筛选,以便将满足条件的日志进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日
该字段内容填为“application/json;charset=utf-8”。 必选 application/json;charset=utf-8 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - Deployment-Name 应用名称 必选 - 响应消息 响应参数 响应参数如表3所示。
接口调用 接口调用主要是对外部服务调用当前应用程序进行监控,主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控等。 相关配置请参见查看组件接口调用监控项。 基础监控 基础监控主要针对应用的JVM信息、JVM监控、GC监控、线程、JAVA方法进行监控。
Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 PromQL Prometheus监控的查询语言。支持瞬时查询和时间跨度查询,内置多种