搜索_华为云

高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

方便灵活地进行定制化开发。应用场景4：高精度资源调度 Volcano 在支持AI，大数据等作业的时候提供了高精度的资源调度策略，例如在深度学习场景下计算效率非常重要。以TensorFlow计算为例，配置“ps”和“worker”之间的亲和性，以及“ps”与“ps”之间的反亲和性

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布应用服务网格（Application Service Mesh，简称ASM）是基于开源Istio推出的服务网格平台，它深度、无缝对接了企业级Kubernetes集群服务云容器引擎（CCE），在易用性、可靠性、可视化等方面进行了一系列增强，可为客户提供开箱即用的上手体验。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

虚拟化资源的无状态负载，并将GPU申请量设为大于集群现有GPU资源上限。例如：集群中有16GiB显存的资源，假设每个Pod占用1GiB显存，则设置Pod数量为17个，合计17GiB显存。在等待一小段时间后，可以在节点池详情页面中，可观察到GPU节点的扩容。父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
如何扩容容器的存储空间？ - 云容器引擎 CCE

如何扩容容器的存储空间？使用场景容器默认大小为10G，当容器中产生数据较多时，容易导致容器存储空间不足，可以通过此方法来扩容。解决方案登录CCE控制台，单击集群列表中的集群名称。在左侧导航栏中选择“节点管理”。切换至“节点”页签，选择集群中的节点，单击操作列中的“更多

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
弹性伸缩概述 - 云容器引擎 CCE

就需要为集群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
工作负载异常：实例调度失败 - 云容器引擎 CCE

工作负载异常：实例调度失败问题定位当Pod状态为“Pending”，事件中出现“实例调度失败”的信息时，可根据具体事件信息确定具体问题原因。事件查看方法请参见工作负载状态异常定位方法。排查思路根据具体事件信息确定具体问题原因，如表1所示。表1 实例调度失败事件信息问题原因与解决方案

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
目标集群资源规划 - 云容器引擎 CCE

务器、开发、测试环境以及中低性能数据库等场景。 GPU加速型：提供优秀的浮点计算能力，从容应对高实时、高并发的海量计算场景。P系列适合于深度学习，科学计算，CAE等；G系列适合于3D动画渲染，CAD等。仅支持1.11及以上版本集群添加GPU加速型节点。高性能计算型：实例提供具有

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow 资源准备购买CCE集群，购买GPU节点并使用gpu-beta插件安装显卡驱动。在集群下添加一个对象存储卷。数据预置从https://github.com/zalandoresearch/fashion-mnist下载数据。获取

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

DaemonSet NPU指标指标监控级别备注 cce_npu_memory_total NPU卡 NPU卡显存总量 cce_npu_memory_used NPU卡 NPU卡显存使用量 cce_npu_utilization NPU卡 NPU卡算力使用率如何确认节点NPU驱动已安装完成

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
跨账号挂载对象存储 - 云容器引擎 CCE

跨账号挂载对象存储应用场景跨账号数据共享。例如，公司内部多团队需要共享数据，但不同团队使用不同的账号。跨账户数据迁移和备份。例如，账号A即将停用，所有的数据需要迁移至账户B。数据处理与分析。例如，账号B是外部数据处理商，需要访问账户A的原始数据进行大数据分析和机器学习等操作。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发、构建、训练、部署四个环节，可全面支持企业用户的机器学习、深度学习完整使用过程。如下图所示：通过Kubeflow 1.0，用户可以使用Jupyter开发模型，然后使用fairing（SDK）等工具构

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

CCE Standard集群、CCE Turbo集群支持 CCE基于Volcano调度器提供多元算力资源调度及任务调度的能力，面向机器学习、深度学习、生物信息学、基因组学及其他大数据应用场景提供完整的应用调度特性。 CCE支持CPU资源调度、GPU/NPU异构资源调度、在离线作业混合部署、CPU

帮助中心 > 云容器引擎 CCE > 功能总览
节点规格（flavor）说明 - 云容器引擎 CCE

节点规格（flavor）说明不同区域支持的节点规格（flavor）不同，且节点规格存在新增、售罄下线等情况，建议您在使用前登录CCE控制台，在创建节点界面查看您需要的节点规格是否支持。 CCE Standard集群 CCE集群只支持2U4G以上的规格，建议您通过控制台查询节点规格，具体节点规格名称请参见规格清单。

帮助中心 > 云容器引擎 CCE > API参考 > 附录
集群成本管理最佳实践 - 云容器引擎 CCE

当集群资源不足时，调度器主动驱逐低优先级业务，保障高优先级业务正常调度。共享使用GPU资源使用GPU虚拟化能力实现算力和显存隔离，高效利用GPU设备资源。CCE GPU虚拟化采用自研xGPU虚拟化技术，能够动态对GPU设备显存与算力进行划分，相对于静态分配来说，虚拟化的方案更加灵活，最大程度保证业务稳定的前提下，

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
集群概述 - 云容器引擎 CCE
集群概述 - 云容器引擎 CCE

GPU：支持以GPU实例作为集群工作节点，并具备全面的GPU兼容生态，支持GPU调度、监控、弹性伸缩等全生命周期操作。详情请参见GPU调度。 GPU虚拟化：支持对GPU设备显存与算力进行动态划分，多个容器共享一个GPU设备且相互隔离，提高GPU利用率。详情请参见GPU虚拟化。 NPU：支持以NPU实例作为集群工作

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群
调度算法 - 云容器引擎 CCE
调度算法 - 云容器引擎 CCE

是否允许修改作用范围 xGPU true/false true 允许 CCE Standard/CCE Turbo 支持GPU单卡算力、显存分割与隔离的调度能力配置建议：使用GPU的场景默认开启，不使用GPU资源可以选择关闭昇腾NPU预选调度支持昇腾NPU HCCS亲和预选调度

 帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
什么是云容器引擎 - 云容器引擎 CCE

什么是云容器引擎云容器引擎（Cloud Container Engine，简称CCE）是一个企业级的Kubernetes集群托管服务，支持容器化应用的全生命周期管理，为您提供高度可扩展的、高性能的云原生应用部署和管理方案。为什么选择云容器引擎云容器引擎深度整合高性能的计算（

帮助中心 > 云容器引擎 CCE > 产品介绍
视频帮助 - 云容器引擎 CCE
视频帮助 - 云容器引擎 CCE

None 服务介绍云容器引擎 CCE 三分钟带你了解云容器引擎CCE 03:03 三分钟了解云容器引擎CCE 云容器引擎 CCE 探索云容器的编排与调度技术 03:19 探索云容器的编排与调度技术特性讲解 CCE Autopilot集群介绍CCE Autopilot集群 10:36

帮助中心 > 云容器引擎 CCE > 视频帮助
集群安装nginx-ingress插件失败，一直处于创建中？ - 云容器引擎 CCE

集群安装nginx-ingress插件失败，一直处于创建中？问题背景客户已经购买并搭建了CCE集群，希望在公网上可以访问到CCE上部署的应用服务，目前最高效的方式是在ingress资源上注册该应用的Service路径，从而满足要求。但客户安装ingress插件后，插件状态一

 帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
工作负载异常：实例拉取镜像失败 - 云容器引擎 CCE

工作负载异常：实例拉取镜像失败问题定位当工作负载状态显示“实例未就绪：Back-off pulling image "xxxxx"”，该状态下工作负载实例K8s事件名称为“实例拉取镜像失败”或“重新拉取镜像失败”。查看K8s事件的方法请参见Pod事件查看方法。排查思路根据

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

高性能调度 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

如何扩容容器的存储空间？ - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

工作负载异常：实例调度失败 - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

跨账号挂载对象存储 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

节点规格（flavor）说明 - 云容器引擎 CCE

集群成本管理最佳实践 - 云容器引擎 CCE

集群概述 - 云容器引擎 CCE

调度算法 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

视频帮助 - 云容器引擎 CCE

集群安装nginx-ingress插件失败，一直处于创建中？ - 云容器引擎 CCE

工作负载异常：实例拉取镜像失败 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线