搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台，它弥补了Kubernetes在机器学习、深度学习、HPC、大数据计算等场景下的基本能力缺失，其中包括gang-schedule的调度能力、计算任务队列管理、task-topology

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
CCE最佳实践汇总 - 云容器引擎 CCE

以下所有第三方教程均来自于华为云社区。由于云容器引擎产品持续更新与迭代，开发者社区教程中的步骤可能存在时效性，不一定与产品最新操作步骤完全保持一致，相关内容仅供学习和参考。表2 开发者社区精选最佳实践分类相关文档 Kubernetes生态相关 CCE集群命名空间级别子账号权限配置使用Terra

帮助中心 > 云容器引擎 CCE > 最佳实践
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

于容器和Kubernetes构建，旨在为数据科学家、机器学习工程师、系统运维人员提供面向机器学习业务的敏捷部署、开发、训练、发布和管理平台。它利用了云原生技术的优势，让用户更快速、方便地部署、使用和管理当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件简介 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。 Volcano提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
弹性伸缩概述 - 云容器引擎 CCE

就需要为集群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

方便灵活地进行定制化开发。应用场景4：高精度资源调度 Volcano 在支持AI，大数据等作业的时候提供了高精度的资源调度策略，例如在深度学习场景下计算效率非常重要。以TensorFlow计算为例，配置“ps”和“worker”之间的亲和性，以及“ps”与“ps”之间的反亲和性

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
什么是云容器引擎 - 云容器引擎 CCE

根据业务需求和策略，经济地自动调整弹性计算资源的管理服务。服务治理：深度集成应用服务网格，提供开箱即用的应用服务网格流量治理能力，用户无需修改代码，即可实现灰度发布、流量治理和流量监控能力。容器运维：深度集成容器智能分析，可实时监控应用及资源，支持采集、管理、分析日志，采集各项指标及事件并提供一键开启的告警能力。

帮助中心 > 云容器引擎 CCE > 产品介绍
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

NPU调度可以指定Pod申请NPU的数量，为工作负载提供NPU资源。 NPU调度 Volcano调度 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
视频帮助 - 云容器引擎 CCE
视频帮助 - 云容器引擎 CCE

Ingress对多个应用进行弹性伸缩 6:59 通过Nginx Ingress实现弹性伸缩华为云学院云原生王者之路云原生知识体系深度剖析，带您走上王者之路学习周期: 4周每周学时: 6-8小时云原生王者之路云原生应用架构通过本课程了解云原生应用场景及对应的华为云方案 4小时

 帮助中心 > 云容器引擎 CCE > 视频帮助
使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布应用服务网格（Application Service Mesh，简称ASM）是基于开源Istio推出的服务网格平台，它深度、无缝对接了企业级Kubernetes集群服务云容器引擎（CCE），在易用性、可靠性、可视化等方面进行了一系列增强，可为客户提供开箱即用的上手体验。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
目标集群资源规划 - 云容器引擎 CCE

VPC网络：采用VPC路由方式与底层网络深度整合，适用于高性能场景，节点数量受限于虚拟私有云VPC的路由配额。容器隧道网络（Overlay）：基于底层VPC网络，另构建了独立的VXLAN隧道化容器网络，适用于一般场景。云原生2.0：深度整合弹性网卡（Elastic Network

帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
跨账号挂载对象存储 - 云容器引擎 CCE

/tmp/test01.txt 回显内容如下，说明Pod对自己创建的对象具有读写权限。 test 步骤四：清理资源完成该示例的学习后，您可以清理相关资源以避免产生结算费用。如果您打算学习其他示例，请等到完成这些示例后再进行清理。利用以下命令删除工作负载。 kubectl delete -f o

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
（停止维护）Kubernetes 1.13版本说明 - 云容器引擎 CCE

CCE集群支持创建裸金属节点（容器隧道网络）支持AI加速型节点（搭载海思Ascend 310 AI处理器），适用于图像识别、视频处理、推理计算以及机器学习等场景支持配置docker baseSize 支持命名空间亲和调度支持节点数据盘划分用户空间支持集群cpu管理策略支持集群下的节点跨子网（容器隧道网络）

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群版本发布说明 > Kubernetes版本发布记录
（停止维护）Kubernetes 1.13版本说明 - 云容器引擎 CCE

CCE集群支持创建裸金属节点（容器隧道网络）支持AI加速型节点（搭载海思Ascend 310 AI处理器），适用于图像识别、视频处理、推理计算以及机器学习等场景支持配置docker baseSize 支持命名空间亲和调度支持节点数据盘划分用户空间支持集群cpu管理策略支持集群下的节点跨子网（容器隧道网络）

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸载您自建的Pro

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
修改CCE集群配置 - 云容器引擎 CCE

修改CCE集群配置操作场景 CCE支持对集群配置参数进行管理，通过该功能您可以对核心组件进行深度配置。操作步骤登录CCE控制台，在左侧导航栏中选择“集群管理”。找到目标集群，查看集群的更多操作，并选择“配置管理”。图1 配置管理在侧边栏滑出的“配置管理”窗口中，根据业

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

CCE Standard集群、CCE Turbo集群支持 CCE基于Volcano调度器提供多元算力资源调度及任务调度的能力，面向机器学习、深度学习、生物信息学、基因组学及其他大数据应用场景提供完整的应用调度特性。 CCE支持CPU资源调度、GPU/NPU异构资源调度、在离线作业混合部署、CPU

帮助中心 > 云容器引擎 CCE > 功能总览
节点规格说明 - 云容器引擎 CCE

125TFLOPS Tensor Core 深度学习加速 300GiB/s NVLINK 机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。 CCE Standard集群推理加速型 Pi2ne NVIDIA T4（GPU直通） 2560 8.1TFLOPS

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点

总条数： 47

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

CCE最佳实践汇总 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

视频帮助 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

跨账号挂载对象存储 - 云容器引擎 CCE

（停止维护）Kubernetes 1.13版本说明 - 云容器引擎 CCE

（停止维护）Kubernetes 1.13版本说明 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

修改CCE集群配置 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

节点规格说明 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线