搜索_华为云

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

附录：DCGM-Exporter组件故障排查运行状态检查在CCE AI套件（NVIDIA GPU）插件页面检查Pod状态为“运行中”。查看Pod日志，确认HTTP服务器开始监听。在集群上使用curl命令访问DCGM-Exporter，确认数据正常获取。检查DCGM-Exporter组件Pod IP： kubectl

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
自定义资源配置 - 云容器引擎 CCE

ing.coreos.com/v1/servicemonitors。配置建议：创建新的自定义资源时，Kubernetes API 服务器会为您所指定的每个版本生成一个新的 RESTful 资源路径。自定义资源名称的单数形式自定义资源名称的单数形式参数名取值范围默认值

 帮助中心 > 云容器引擎 CCE > 配置参考 > 自定义资源
升级实例过程中实现业务不中断 - 云容器引擎 CCE

od所在的节点，不存在跨节点转发，因此可以保留源IP。但是在Local模式下，如果实例滚动升级时Pod所在节点发生变化，导致ELB侧后端服务器会同步变化，可能会出现服务中断。这种情况下可以通过实例原地升级的方式避免服务中断，即保证ELB后端的节点上存在一个正常状态的Pod。综上

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
创建CronHPA定时策略 - 云容器引擎 CCE

策略触发时，工作负载实例将在此范围内伸缩。须知：在CCE Turbo集群中，如果使用独享型ELB对接到工作负载，则最大实例数不能超过ELB的后端服务器组配额（默认为500），否则将会导致多余的实例无法添加到ELB后端。冷却时间请输入缩容和扩容的冷却时间，单位为分钟，缩容扩容冷却时间不能小于1分钟。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
CCE集群弹性引擎 - 云容器引擎 CCE

件被卸载后，如果节点上依然存在该污点请您手动进行删除。约束与限制安装时请确保集群具有足够的资源。该插件功能仅支持虚拟机节点，不支持物理机节点和裸金属服务器。默认节点池不支持弹性扩缩容，详情请参见默认节点池DefaultPool说明。缩容节点会导致与节点关联的本地持久卷类

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

NPD插件版本过低导致进程资源残留问题问题描述在节点负载压力比较大的场景下，可能存在NPD进程资源残留的问题。问题现象登录到CCE集群的ECS节点，查询存在大量npd进程。解决方案升级CCE节点故障检测（简称NPD）插件至最新版本。登录CCE控制台，进入集群，在左侧导航栏中

 帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
Kubernetes安全漏洞公告（CVE-2024-9486，CVE-2024-9594） - 云容器引擎 CCE

es Image Builder中的两个安全漏洞（CVE-2024-9486和CVE-2024-9594），这些漏洞可能允许攻击者获得对虚拟机（VM）的root访问权限。漏洞详情表1 漏洞信息漏洞类型 CVE-ID 漏洞级别披露/发现时间容器逃逸 CVE-2024-9486

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
VPC的子网无法删除，怎么办？ - 云容器引擎 CCE

此需要在CCE界面删除相应的集群后，再删除VPC的子网。删除集群会将集群内的节点以及运行的工作负载和服务都销毁，请谨慎操作。不建议在ECS界面删除CCE集群中的节点。父主题：网络异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
Prometheus（停止维护） - 云容器引擎 CCE

bytes，且一个Prometheus server可以处理数百万的metrics。使用pull模式采集时间序列数据，这样不仅有利于本机测试而且可以避免有问题的服务器推送坏的metrics。可以采用push gateway的方式把时间序列数据推送至Prometheus server端。可以通过服务发

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
工作负载概述 - 云容器引擎 CCE

共享资源的容器。通常这种场景下应用包含一个主容器和几个辅助容器（SideCar Container），如图1所示，例如主容器为一个web服务器，从一个固定目录下对外提供文件服务，而辅助容器周期性的从外部下载文件存到这个固定目录下。图1 Pod 实际使用中很少直接创建Pod，而是

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

创建一个有1个节点的集群，节点规格为2U4G及以上，并在创建节点时为节点添加弹性公网IP，以便从外部访问。如创建节点时未绑定弹性公网IP，您也可以前往ECS控制台为该节点进行手动绑定。给集群安装插件。 autoscaler：节点伸缩插件。 metrics-server：是Kubernetes

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
配置节点故障检测策略 - 云容器引擎 CCE

ReadonlyFilesystem 监听内核日志，检查系统内核是否有Remount root filesystem read-only错误典型场景：用户从ECS侧误操作卸载节点数据盘，且应用程序对该数据盘的对应挂载点仍有持续写操作，触发内核产生IO错误将磁盘重挂载为只读磁盘。说明：节点容器存储Rootfs为Device

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
Kubernetes 1.31版本说明 - 云容器引擎 CCE

Kubernetes 1.31版本说明云容器引擎（CCE）严格遵循社区一致性认证，现已支持创建Kubernetes 1.31集群。本文介绍Kubernetes 1.31版本的变更说明。索引新增特性及特性增强 API变更与弃用 CCE对Kubernetes 1.31版本的增强

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群版本发布说明 > Kubernetes版本发布记录
Kubernetes 1.31版本说明 - 云容器引擎 CCE

Kubernetes 1.31版本说明云容器引擎（CCE）严格遵循社区一致性认证，现已支持创建Kubernetes 1.31集群。本文介绍Kubernetes 1.31版本的变更说明。索引新增特性及特性增强 API变更与弃用 CCE对Kubernetes 1.31版本的增强

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

GPU驱动或GPU设备存在异常，请根据GPU设备所在的节点类型（ECS或BMS），联系对应的客服进行处理。 GPU设备DBE错误与SBE错误总数过高 GPU驱动或GPU设备存在异常，请根据GPU设备所在的节点类型（ECS或BMS），联系对应的客服进行处理。 GPU设备存在Uncorrectable

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
能否只配置命名空间权限，不配置集群管理权限？ - 云容器引擎 CCE

命名空间权限：作用于集群内部，用于管理集群资源操作（如创建工作负载等）。集群管理（IAM）权限：云服务层面的权限，用于管理CCE集群与周边资源（如VPC、ELB、ECS等）的操作。对于IAM Admin用户组的管理员用户来说，可以为IAM子用户授予集群管理权限（如CCE Administrator、CCE

帮助中心 > 云容器引擎 CCE > 常见问题 > 权限
Docker资源管理错误漏洞公告（CVE-2021-21285） - 云容器引擎 CCE

Docker资源管理错误漏洞公告（CVE-2021-21285）漏洞详情 Docker是一款开源的应用容器引擎，支持在Linux系统上创建一个容器（轻量级虚拟机）并部署和运行应用程序，以及通过配置文件实现应用程序的自动化安装、部署和升级。 Docker 19.03.15和20.10.3之前的版本存

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
休眠/唤醒按需计费集群 - 云容器引擎 CCE

节点（ECS）、绑定的弹性IP、带宽等资源仍将按各自的计费方式进行收费。如需关机节点，请在集群休眠提示框中勾选“关机集群下所有节点”或参见节点关机。大部分节点关机后不再收费，特殊ECS实例（包含本地硬盘，如磁盘增强型，超高I/O型等）关机后仍然正常收费，具体请参见ECS计费模式。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
在有状态负载中动态挂载专属存储 - 云容器引擎 CCE

SSD：超高I/O everest.io/csi.dedicated-storage-id 是专属盘所在DSS存储池的ID。获取方法：在云服务器控制台，单击左侧栏目树中的“专属分布式存储 > 存储池”，单击要对接的存储池名称展开详情，复制ID值即可。 everest.io/crypt-key-id

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 专属存储（DSS）
为Nginx Ingress配置GRPC协议的后端服务 - 云容器引擎 CCE

务。和许多其他RPC框架一样，使用gRPC需要定义调用服务的方法，包括参数和返回类型等，服务端需要实现被定义的方法，同时运行一个gRPC服务器来处理客户端请求。准备工作已创建CCE Standard集群，详情请参见购买Standard/Turbo集群。集群中已安装NGINX

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > Nginx Ingress管理 > Nginx Ingress高级配置示例

总条数： 713

上一页
1
...
30
31
32
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标 - 云容器引擎 CCE

自定义资源配置 - 云容器引擎 CCE

升级实例过程中实现业务不中断 - 云容器引擎 CCE

创建CronHPA定时策略 - 云容器引擎 CCE

CCE集群弹性引擎 - 云容器引擎 CCE

NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

Kubernetes安全漏洞公告（CVE-2024-9486，CVE-2024-9594） - 云容器引擎 CCE

VPC的子网无法删除，怎么办？ - 云容器引擎 CCE

Prometheus（停止维护） - 云容器引擎 CCE

工作负载概述 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

Kubernetes 1.31版本说明 - 云容器引擎 CCE

Kubernetes 1.31版本说明 - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

能否只配置命名空间权限，不配置集群管理权限？ - 云容器引擎 CCE

Docker资源管理错误漏洞公告（CVE-2021-21285） - 云容器引擎 CCE

休眠/唤醒按需计费集群 - 云容器引擎 CCE

在有状态负载中动态挂载专属存储 - 云容器引擎 CCE

为Nginx Ingress配置GRPC协议的后端服务 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线