搜索_华为云

工作负载监控 - 云容器引擎 CCE

工作负载监控如果您需要监控工作负载的资源使用情况，可以前往“监控中心 > 工作负载”页面查看。该页面提供了指定集群下所有工作负载的综合信息，以及单个工作负载的详细监控数据，包括CPU/内存使用率、网络流入/流出速率等。功能入口登录CCE控制台，单击集群名称进入集群详情页。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
监控中心 - 云容器引擎 CCE
监控中心 - 云容器引擎 CCE

监控中心监控中心概述开通监控中心管理监控采集任务集群监控节点监控工作负载监控 Pod监控事件监控仪表盘父主题：云原生观测

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测
云原生监控插件 - 云容器引擎 CCE

云原生监控插件插件简介云原生监控插件（原名kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。使用云原生监控插件可将监控数据与监控中心对接，在监控中心控制台查看监控数据，配置告警等。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

GPU）插件使用DCGM-Exporter监控GPU指标对运维人员来说，实现对Kubernetes的大规模GPU设备可监测能力至关重要。通过监测GPU相关指标能够了解整个集群的GPU使用情况、健康状态、工作负载性能等，从而实现对异常问题的快速诊断、优化GPU资源的分配、提升资源利用率等。除运维人员以外，其他

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过控制台获取华为云Prometheus监控数据在集群中安装云原生监控插件，采集Prometheus监控数据。登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
Prometheus Server视图 - 云容器引擎 CCE

Prometheus本地数据存储模式可以收集有关主机和应用程序的指标数据并存储在集群中，监控数据可以选择上报并存储到AOM或三方监控平台。Prometheus Server视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。指标说明 Prometheus Server视图暴露的指标如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
通过AOM配置自定义告警 - 云容器引擎 CCE

根据页面提示填写基本信息后，设置告警规则。关键参数如下：详细参数说明请参见创建事件类告警规则。规则类型：选择“事件告警规则”。事件类型：选择“系统事件”。事件来源：选择“CCE”。监控对象：监控对象可以通过多个维度（通知类型、事件名称、告警级别、自定义属性、命名空间、集群名称）进行筛选，您可以根据需要选择。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。关于GPU指标详情请参见GPU监控指标说明。图3 查看GPU监控指标访问Grafana

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU监控指标说明 - 云容器引擎 CCE

GPU监控指标说明 CCE AI套件（NVIDIA GPU）插件提供GPU监控指标，并集成了DCGM-Exporter组件（要求插件版本2.7.32+），引入更丰富的GPU可观测性场景。本文介绍CCE AI套件（NVIDIA GPU）插件指标的详细信息。计费说明 GPU指标作为

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
Prometheus Agent视图 - 云容器引擎 CCE

Prometheus Agent是轻量化的容器监控模式，可以收集有关主机和应用程序的指标数据，并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。指标说明 Prometheus

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
通过告警中心一键配置告警 - 云容器引擎 CCE

一键开启能力，在集群发生故障时能够及时发现并预警，协助您维护业务稳定性。智能告警中心可有效节省您在AOM侧手动配置告警规则的工作量，并且内置的告警规则基于华为云容器团队大规模集群运维经验，能够满足您的日常运维所需，覆盖容器服务异常事件告警、集群相关基础资源的关键指标告警及集群中应用的指标告警。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

fragMemroy：Frag缓冲区使用量。 rawInuse：正在使用的Raw套接字数量。文件系统异常 / 文件系统状态 readonly：文件系统只读 deviceError：文件系统错误磁盘读写速率次/秒磁盘每秒进行的读写次数磁盘读和写延迟（秒）秒磁盘读写时延 IO队列数

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
健康中心概述 - 云容器引擎 CCE

支持全量检查集群整体运行状况（开通监控中心后），发现集群故障与潜在风险针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因针对故障和潜在风险，给出风险等级并提供修复建议使用场景运维对集群做变更前的集群状况检测，可随时主动触发健康诊断支持运维的定时巡

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
Pod视图 - 云容器引擎 CCE
Pod视图 - 云容器引擎 CCE

容器磁盘读写IO速率(读+写) 次数/秒容器磁盘每秒读写IO次数容器磁盘读写吞吐量(读+写) 字节/秒容器磁盘每秒读写字节数文件系统使用率百分比文件系统的使用率文件系统使用量字节文件系统已经使用的字节数指标清单 Pod视图使用的指标清单如下：表4 Pod视图指标清单指标指标类型说明

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

底层存储细节，因此没有感知底层存储故障的能力。云监控服务CES 具备查看云服务监控指标的能力：云监控服务基于云服务自身的服务属性，已经内置了详细全面的监控指标。当用户在云平台上开通云服务后，系统会根据服务类型自动关联该服务的监控指标，帮助用户实时掌握云服务的各项性能指标，精确掌握云服务的运行情况。

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

PU和内存使用率指标进行弹性伸缩往往无法满足日常运维需求。为此，CCE提供云原生监控插件（kube-prometheus-stack），可全面对接开源Prometheus生态，支持类型丰富的组件监控，并提供了多种开箱即用的预置监控大盘。本文介绍如何将华为云Prometheus指标

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
监控CoreDNS运行状态 - 云容器引擎 CCE

监控CoreDNS运行状态 CoreDNS通过标准的Promethues接口暴露出解析结果等健康指标，发现CoreDNS服务端甚至上游DNS服务器的异常。 CoreDNS自身metrics数据接口，默认zone侦听{$POD_IP}:9153，请保持此默认值，否则普罗无法采集coredns

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 服务端
PVC视图 - 云容器引擎 CCE
PVC视图 - 云容器引擎 CCE

提供了集群中的PVC监控视图，包含PV/PVC的状态、使用率情况。支持以下PVC类型监控：云硬盘类型的PVC（要求volumeMode参数值为Filesystem）支持使用量监控。本地持久卷类型的PVC（要求集群中安装的Everest版本大于等于2.4.41）支持使用量监控。极速文

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘

总条数： 690

上一页
1
2
3
4
5
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作负载监控 - 云容器引擎 CCE

监控中心 - 云容器引擎 CCE

云原生监控插件 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

Prometheus Agent视图 - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

Pod视图 - 云容器引擎 CCE

CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

监控CoreDNS运行状态 - 云容器引擎 CCE

PVC视图 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线