搜索_华为云

监控GPU资源指标 - 云容器引擎 CCE

Targets”，可以查看到Prometheus监控了哪些目标。图2 查看监控目标监控GPU指标创建一个使用GPU的工作负载，等工作负载正常运行后，访问Prometheus，在“Graph”页面中，查看GPU指标。关于GPU指标详情请参见GPU监控指标说明。图3 查看GPU监控指标访问Grafana

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU监控指标说明 - 云容器引擎 CCE

收费。为避免产生额外的费用，建议在启用此功能前仔细阅读价格详情，了解按需计费详细情况。 CCE提供的GPU监控指标表1 GPU基础监控指标类型指标指标类型单位监控级别说明利用率指标 cce_gpu_utilization Gauge % GPU卡 GPU卡算力使用率

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
监控NGINX Ingress控制器指标 - 云容器引擎 CCE

eus监控了哪些目标。图2 查看监控目标监控NGINX Ingress控制器指标访问Prometheus，在“Graph”页面中，查看NGINX Ingress控制器指标。图3 查看NGINX Ingress控制器监控指标表1 NGINX Ingress控制器监控指标指标

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
Prometheus（停止维护） - 云容器引擎 CCE

Prometheus（停止维护）插件简介 Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统，由工作在SoundCloud的Google前员工在2012年创建，作为社区开源项目进行开发，并于2015年正式发布。2016年，Prometheus正式加入Cloud

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
容器使用SCSI类型云硬盘偶现IO卡住如何解决？ - 云容器引擎 CCE

容器使用SCSI类型云硬盘偶现IO卡住如何解决？问题描述容器使用SCSI类型的云硬盘存储，在CentOS节点上创建和删除容器触发磁盘频繁挂载卸载的场景，有概率会出现系统盘读写瞬时冲高，然后系统卡住的问题，影响节点正常工作。出现该问题时，可在dmesg日志中观察到： Attached

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
同步云服务器 - 云容器引擎 CCE

同步云服务器操作场景集群中的每一个节点对应一台云服务器，集群节点创建成功后，您仍可以根据需求，修改云服务器的名称或变更规格。由于规格变更对业务有影响，建议一台成功完成后再对下一台进行规格变更。 CCE节点的部分信息是独立于弹性云服务器ECS维护的，当您在ECS控制台修改云服务

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
云原生监控插件版本发布记录 - 云容器引擎 CCE

云原生监控插件版本发布记录表1 云原生监控插件版本记录插件版本支持的集群版本更新特性社区版本 3.12.0 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 适配CCE v1.31集群升级Prometheus版本 2.53

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致问题现象容器监控的内存使用率与实际弹性伸缩现象不一致，例如容器内存使用率在界面上显示为40%左右，而HPA设置缩容阈值为70%，但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。问题根因界面上显示的容器内存使用率与HPA弹

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 监控日志
云服务器无法纳管至节点池时如何修改云服务器配置 - 云容器引擎 CCE

修改云服务器的企业项目云服务器组不一致将云服务器的云服务器组修改成与节点池的云服务器组一致。修改云服务器的云服务器组修改云服务器的规格待纳管云服务器规格需修改成节点池中包含的规格。更多操作指导请参见ECS变更规格通用操作。登录ECS控制台。单击目标云服务器名称，

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点池
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过控制台获取华为云Prometheus监控数据在集群中安装云原生监控插件，采集Prometheus监控数据。登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”。在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
基于ELB监控指标的弹性伸缩实践 - 云容器引擎 CCE

class 根据上一步查询到ELB实例ID，使用查询监听器接口查询监听器ID。获取ELB监控数据。 ELB的调用CES批量查询监控数据接口，查询ELB的监控数据，ELB详细的监控数据指标请参见ELB监控指标说明。例如如下几种参数 m1_cps：并发连接数 m5_in_pps：流入数据包数

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
计算配置 - 云容器引擎 CCE
计算配置 - 云容器引擎 CCE

Standard集群：弹性云服务器-虚拟机：基于弹性云服务器部署容器服务。弹性云服务器-物理机：基于擎天架构的服务器部署容器服务。裸金属服务器：基于裸金属服务器部署容器服务，需要挂载本地盘或支持挂载云硬盘。 CCE Turbo集群：弹性云服务器-虚拟机：基于弹性云服务器部署容器服务，仅支持可添加多张弹性网卡的机型。

帮助中心 > 云容器引擎 CCE > 配置参考 > 节点
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
自定义StorageClass - 云容器引擎 CCE

参数是否必选描述云硬盘 csi.storage.k8s.io/csi-driver-name 是驱动类型，使用云硬盘类型时，参数取值固定为“disk.csi.everest.io”。 csi.storage.k8s.io/fstype 是使用云硬盘时，支持的参数值为“ext4”。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

在“插件中心”页面右侧找到云原生监控插件，单击“安装”。在监控CCE Turbo集群容器网络扩展指标的场景下，建议您关注以下配置。该插件的其他配置可按需进行设置，详情请参见云原生监控插件。本地数据存储：此处选择使用本地存储监控数据，监控数据可选择是否对接AOM或三方监控平台。自定义指标采

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
云原生监控插件升级检查异常处理 - 云容器引擎 CCE

云原生监控插件升级检查异常处理检查项内容在集群升级过程中，云原生监控插件从3.9.0之前的版本升级至3.9.0之后的版本升级时，存在兼容性问题，需检查该插件是否开启了grafana的开关。解决方案由于云原生监控插件在3.9.0之后的版本，不再聚合grafana的能力，因此

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
工作负载异常：添加存储失败 - 云容器引擎 CCE

该告警事件说明节点上绑定的云硬盘已达上限，挂载云硬盘的工作负载实例调度到该节点后，无法继续挂载云硬盘，导致工作负载无法正常运行。例如，假设节点可挂载的云硬盘上限为20，除去节点上已挂载的1块系统盘和1块数据盘后，节点剩余可挂载的云硬盘数量为18块。若该节点通过ECS控制台自定义挂载了2

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
CCE AI套件（NVIDIA GPU）插件使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

DCGM构建，提供了更强大的GPU监控功能。DCGM提供了种类丰富的GPU监控指标，功能特性如下： GPU行为监控 GPU配置管理 GPU Policy管理 GPU健康诊断 GPU级别统计和线程级别统计 NVSwitch配置和监控本文基于CCE云原生监控插件和dcgm-exporte

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
CCE集群中的EVS存储卷被删除或者过期后是否可以恢复？ - 云容器引擎 CCE

CCE集群中的EVS存储卷被删除或者过期后是否可以恢复？云硬盘EVS存储需要人工配置备份策略。如果卷被删除或者释放，可以使用云硬盘备份恢复数据。详细请参见备份云硬盘。父主题：存储管理

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
系统委托说明 - 云容器引擎 CCE

由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系，因此当您首次登录CCE控制台时，CCE将自动请求获取当前区域下的云资源权限，从而更好地为您提供服务。服务权限包括：计算类服务 CCE集群创建节点时会关联创建云服务器，因此需要获取访问弹性云服务器、裸金属服务器的权限。存储类服务

 帮助中心 > 云容器引擎 CCE > 用户指南 > 权限

总条数： 666

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控GPU资源指标 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

监控NGINX Ingress控制器指标 - 云容器引擎 CCE

Prometheus（停止维护） - 云容器引擎 CCE

容器使用SCSI类型云硬盘偶现IO卡住如何解决？ - 云容器引擎 CCE

同步云服务器 - 云容器引擎 CCE

云原生监控插件版本发布记录 - 云容器引擎 CCE

容器监控的内存使用率与实际弹性伸缩现象不一致 - 云容器引擎 CCE

云服务器无法纳管至节点池时如何修改云服务器配置 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

基于ELB监控指标的弹性伸缩实践 - 云容器引擎 CCE

计算配置 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

自定义StorageClass - 云容器引擎 CCE

监控CCE Turbo集群容器网络扩展指标 - 云容器引擎 CCE

云原生监控插件升级检查异常处理 - 云容器引擎 CCE

工作负载异常：添加存储失败 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

CCE集群中的EVS存储卷被删除或者过期后是否可以恢复？ - 云容器引擎 CCE

系统委托说明 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线