搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台，它弥补了Kubernetes在机器学习、深度学习、HPC、大数据计算等场景下的基本能力缺失，其中包括gang-schedule的调度能力、计算任务队列管理、task-topology和

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件简介 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。 Volcano提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
最新动态 - 云容器引擎 CCE
最新动态 - 云容器引擎 CCE

最新动态本文介绍了云容器引擎CCE的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2023年8月序号功能名称功能描述阶段相关文档 1 云容器引擎CCE Kubernetes 1.27版本公测云容器引擎CCE支持创建Kubernetes

帮助中心 > 云容器引擎 CCE > 最新动态
弹性伸缩概述 - 云容器引擎 CCE

就需要为集群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

为工作负载提供NPU资源。 NPU调度 Volcano调度 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

方便灵活地进行定制化开发。应用场景4：高精度资源调度 Volcano 在支持AI，大数据等作业的时候提供了高精度的资源调度策略，例如在深度学习场景下计算效率非常重要。以TensorFlow计算为例，配置“ps”和“worker”之间的亲和性，以及“ps”与“ps”之间的反亲和性

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
集群网络模型选择及各模型区别 - 云容器引擎 CCE

集群网络模型选择及各模型区别自研高性能商业版容器网络插件，支持容器隧道网络、VPC网络、云原生网络2.0网络模型：集群创建成功后，网络模型不可更改，请谨慎选择。容器隧道网络（Overlay）：基于底层VPC网络构建了独立的VXLAN隧道化容器网络，适用于一般场景。VXLAN

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络
CCE最佳实践汇总 - 云容器引擎 CCE

CCE最佳实践汇总本文汇总了云容器引擎（CCE）服务的常见应用场景，并为每个场景提供详细的方案描述和操作指南，以帮助您在CCE集群中轻松搭建业务。 CCE最佳实践开发者社区精选最佳实践 Solution as Code一键式部署类最佳实践表1 CCE最佳实践分类相关文档

 帮助中心 > 云容器引擎 CCE > 最佳实践
通过告警中心一键配置告警 - 云容器引擎 CCE

通过告警中心一键配置告警告警中心基于AOM告警功能，提供集群内置告警一键开启能力，在集群发生故障时能够及时发现并预警，协助您维护业务稳定性。智能告警中心可有效节省您在AOM侧手动配置告警规则的工作量，并且内置的告警规则基于华为云容器团队大规模集群运维经验，能够满足您的日常运维所

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
什么是云容器引擎 - 云容器引擎 CCE

什么是云容器引擎云容器引擎（Cloud Container Engine，简称CCE）是一个企业级的Kubernetes集群托管服务，支持容器化应用的全生命周期管理，为您提供高度可扩展的、高性能的云原生应用部署和管理方案。为什么选择云容器引擎云容器引擎深度整合高性能的计算（

帮助中心 > 云容器引擎 CCE > 产品介绍
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发、构建、训练、部署四个环节，可全面支持企业用户的机器学习、深度学习完整使用过程。如下图所示：通过Kubeflow 1.0，用户可以使用Jupyter开发模型，然后使用fairing（SDK）等工具构

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
创建集群 - 云容器引擎 CCE
创建集群 - 云容器引擎 CCE

创建集群功能介绍该API用于创建一个空集群（即只有控制节点Master，没有工作节点Node）。请在调用本接口完成集群创建之后，通过创建节点添加节点。集群管理的URL格式为：https://Endpoint/uri。其中uri为资源路径，也即API访问的路径。调用该接口创

 帮助中心 > 云容器引擎 CCE > API参考 > API > 集群管理
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

CCE Standard集群、CCE Turbo集群支持 CCE基于Volcano调度器提供多元算力资源调度及任务调度的能力，面向机器学习、深度学习、生物信息学、基因组学及其他大数据应用场景提供完整的应用调度特性。 CCE支持CPU资源调度、GPU/NPU异构资源调度、在离线作业混合部署、CPU

帮助中心 > 云容器引擎 CCE > 功能总览
获取指定的集群 - 云容器引擎 CCE

获取指定的集群功能介绍该API用于获取指定集群的详细信息。集群管理的URL格式为：https://Endpoint/uri。其中uri为资源路径，也即API访问的路径。调用方法请参见如何调用API。 URI GET /api/v3/projects/{project_i

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群管理
在CCE集群中部署使用ClickHouse - 云容器引擎 CCE

在CCE集群中部署使用ClickHouse ClickHouse是一款用于联机分析（OLAP）的列式数据库管理系统，适用于处理大规模数据集的实时查询和分析。ClickHouse容器化部署方式主要有4种，具体请参见表1。ClickHouse Operator是在Kubernetes

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
节点规格说明 - 云容器引擎 CCE

Core 深度学习加速云桌面、图像渲染、3D可视化、重载图形设计。 CCE Standard集群计算加速型 P2s NVIDIA V100 5120 14TFLOPS 单精度浮点计算 7TFLOPS 双精度浮点计算 112TFLOPS Tensor Core 深度学习加速 AI

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
修改CCE集群配置 - 云容器引擎 CCE

修改CCE集群配置集群配置参数是分布式系统中用于定义节点行为、资源分配、通信规则、扩展策略等的底层规则集，会影响集群的性能、稳定性、扩展性和容错能力。通过调整CCE集群的配置参数，您可以对核心组件进行深度配置。集群配置参数主要分为以下几类，您可以根据需求进行调整。表1 集群配置参数分类

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
目标集群资源规划 - 云容器引擎 CCE

务器、开发、测试环境以及中低性能数据库等场景。 GPU加速型：提供优秀的浮点计算能力，从容应对高实时、高并发的海量计算场景。P系列适合于深度学习，科学计算，CAE等；G系列适合于3D动画渲染，CAD等。仅支持1.11及以上版本集群添加GPU加速型节点。高性能计算型：实例提供具有

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE

总条数： 25

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

最新动态 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

集群网络模型选择及各模型区别 - 云容器引擎 CCE

CCE最佳实践汇总 - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

创建集群 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

获取指定的集群 - 云容器引擎 CCE

在CCE集群中部署使用ClickHouse - 云容器引擎 CCE

节点规格说明 - 云容器引擎 CCE

修改CCE集群配置 - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线