搜索_华为云

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

eus监控了哪些目标。图2 查看监控目标监控NGINX Ingress控制器指标访问Prometheus，在“Graph”页面中，查看NGINX Ingress控制器指标。图3 查看NGINX Ingress控制器监控指标表1 NGINX Ingress控制器监控指标指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置集群中包含GPU节点时，可通过GPU指标查看节点GPU资源的使用情况，例如GPU利用率、显存使用量等。在获取GPU监控指标后，用户可根据应用的GPU指标配置弹性伸缩策略，在业务波动时自适应调整应用的副本数量。前提条件目标集群已创建，且

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？问题描述： CCE集群界面的某个节点磁盘监控高达80%以上，而进入云监控界面看到的磁盘使用率在40%不到。后面在该节点上排查，发现有一个pvc磁盘使用达到了92%，将这个盘清理后，集群界面的磁盘使用率和云监控使用率一致了。请问集群界面的节点监控是怎么

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件介绍 CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。no

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Grafana - 云容器引擎 CCE
Grafana - 云容器引擎 CCE

Grafana 插件简介 Grafana是一款开源的数据可视化和监控平台，可以为您提供丰富的图表和面板，用于实时监控、分析和可视化各种指标和数据源。安装插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”，在右侧找到Grafana，单击“安装”。设置插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

DCGM构建，提供了更强大的GPU监控功能。DCGM提供了种类丰富的GPU监控指标，功能特性如下： GPU行为监控 GPU配置管理 GPU Policy管理 GPU健康诊断 GPU级别统计和线程级别统计 NVSwitch配置和监控本文基于CCE云原生监控插件和DCGM Exporte

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

通过监控中心查看Master节点组件指标云原生监控中心已支持对Master节点的kube-apiserver组件进行监控，您在集群中开通云原生监控中心后（安装云原生监控插件版本为3.5.0及以上），可以查看仪表盘中的APIServer视图，监控API指标。如需对kube-controller、kube-sched

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件简介 CCE节点故障检测插件（原名NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。NPD可以作为DaemonSet运行，也可以独立运行。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
健康中心概述 - 云容器引擎 CCE

健康诊断覆盖范围如下图所示：图1 健康诊断覆盖范围健康诊断能力项支持开箱即用，可以在不开通监控中心情况下，进行基础的集群健康诊断支持全量检查集群整体运行状况（开通监控中心后），发现集群故障与潜在风险针对诊断结果，智能给出健康评分支持定时巡检，并可视化巡检结果支持查看巡检历史，方便用户分析故障原因

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
通过告警中心一键配置告警 - 云容器引擎 CCE

告警中心中的指标类告警规则依赖云原生监控插件上报指标数据到AOM Prometheus实例，需要开通监控中心。当您的集群未安装插件或者在安装插件时未对接AOM Prometheus实例，告警中心将不会创建指标类告警规则。开通监控中心请参考开通监控中心。表1中使用problem_g

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
Prometheus插件平滑迁移实践 - 云容器引擎 CCE

21以上，您需要将停止维护的Prometheus插件迁移至云原生监控插件，以获取后续的技术支持。本文将指导您将已经停止维护的Prometheus插件迁移至云原生监控插件。云原生监控插件与Prometheus插件的对比如下：云原生监控插件 Prometheus插件（停止维护）云原生监控插件是基于Prometheu

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
仪表盘 - 云容器引擎 CCE
仪表盘 - 云容器引擎 CCE

CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

XGPU视图 XGPU是虚拟化的GPU设备，从XGPU视图可以在节点、GPU卡、容器等多个角度监控XGPU虚拟化设备的显存、算力分配率，帮助您掌控GPU运行状况。指标说明图1 XGPU资源指标表1 XGPU视图图表说明图表名称单位说明集群-XGPU设备显存使用率百分比

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
Pod视图 - 云容器引擎 CCE
Pod视图 - 云容器引擎 CCE

Pod视图从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况，帮助您详细了解Pod的运行状态。指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标，具体说明如下：图1 Pod资源指标表1 Pod资源指标说明指标名称单位说明容器数个

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
主机视图 - 云容器引擎 CCE
主机视图 - 云容器引擎 CCE

主机视图从主机视角出发，监控主机的资源占用与健康状态，查看主机的磁盘、文件系统等常用系统设备指标，帮助您掌控节点运行状况。指标说明主机视图暴露的指标具体说明如下：图1 主机资源指标表1 视图说明图表名称单位说明 CPU使用率百分比每个CPU核的使用率平均负载

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
CoreDNS视图 - 云容器引擎 CCE
CoreDNS视图 - 云容器引擎 CCE

CoreDNS视图提供了负载域名解析的CoreDNS监控视图，包含请求、响应情况，以及缓存状况。指标说明 CoreDNS视图暴露的指标如下：图1 CoreDNS视图指标表1 CoreDNS指标说明指标名称单位说明请求速率个/秒 CoreDNS每秒请求个数请求速率(记录类型)

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
使用仪表盘 - 云容器引擎 CCE
使用仪表盘 - 云容器引擎 CCE

集群处于“运行中”状态。集群已开通“监控中心”。查看/切换视图登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“监控中心”，单击“仪表盘”页签，默认展示集群视图。监控中心仪表盘提供了预置视图，您可单击视图名称边上的“切换视图”按钮，选择需要的视图查看监控数据。设置查看视图的相关参数。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
创建HPA策略 - 云容器引擎 CCE
创建HPA策略 - 云容器引擎 CCE

使用自定义策略时，集群中需要安装支持采集自定义指标的插件（例如Prometheus），且工作负载需正常上报并采集自定义指标。采集自定义指标的方法及示例请参见使用云原生监控插件监控自定义指标。自定义指标名称：自定义指标的名称，输入时可根据联想值进行选择。指标来源：在下拉框中选择对象类型，可选择“Pod”。期

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
APIServer视图 - 云容器引擎 CCE
APIServer视图 - 云容器引擎 CCE

APIServer视图提供了Kubernetes核心组件APIServer主要监控视图，帮助您更好的监控APIServer的运行状态。主要包括APIServer组件的请求、资源、工作队列等相关指标。指标说明 APIServer视图暴露的指标包括请求指标、工作队列指标和资源指标，具体说明如下：

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

步骤一：安装云原生监控插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。本地数据存储：使用本地存储监控数据，监控数据可选择是否上报至AOM或三方监控平台。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩

总条数： 262

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

为什么CCE集群界面的节点磁盘监控看起来不准确？ - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

Grafana - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

使用Prometheus监控Master节点组件指标 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

健康中心概述 - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

Prometheus插件平滑迁移实践 - 云容器引擎 CCE

仪表盘 - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

Pod视图 - 云容器引擎 CCE

主机视图 - 云容器引擎 CCE

CoreDNS视图 - 云容器引擎 CCE

使用仪表盘 - 云容器引擎 CCE

创建HPA策略 - 云容器引擎 CCE

APIServer视图 - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线