搜索_华为云

Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

该示例的主要功能是基于Tensorflow的分布式架构，利用卷积神经网络（CNN）中的ResNet50模型对随机生成的图像进行训练，每次训练32张图像（batch_size），共训练100次（step），记录每次训练过程中的性能（image/sec）。 apiVersion: "kubeflow.org/v1"

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

本机网络提供传输效率，缩短训练时间。 Volcano批量调度系统：加速AI计算的利器 Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台，它弥补了Kubernetes在机器学习、深度学习、HPC、大数据计算等场景

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

旨在为数据科学家、机器学习工程师、系统运维人员提供面向机器学习业务的敏捷部署、开发、训练、发布和管理平台。它利用了云原生技术的优势，让用户更快速、方便地部署、使用和管理当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发、构建、训练、部署四个环节，可全

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件简介 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。 Volcano提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

应用场景企业应用的流量大小不是每时每刻都一样，有高峰，有低谷，如果每时每刻都要保持能够扛住高峰流量的机器数目，那么成本会很高。通常解决这个问题的办法就是根据流量大小或资源占用率自动调节机器的数量，也就是弹性伸缩。当使用Pod/容器部署应用时，通常会设置容器的申请/限制值来确定可使用

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

应用场景企业应用的流量大小不是每时每刻都一样，有高峰，有低谷，如果每时每刻都要保持能够扛住高峰流量的机器数目，那么成本会很高。通常解决这个问题的办法就是根据流量大小或资源占用率自动调节机器的数量，也就是弹性伸缩。当使用Pod/容器部署应用时，通常会设置容器的申请/限制值来确定可使用

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
容器 - 云容器引擎 CCE
容器 - 云容器引擎 CCE

首先开发者在开发环境机器上开发应用并制作镜像。 Docker执行命令，构建镜像并存储在机器上。开发者发送上传镜像命令。 Docker收到命令后，将本地镜像上传到镜像仓库。开发者向生产环境机器发送运行镜像命令。生产环境机器收到命令后，Docker会从镜像仓库拉取镜像到机器上，然后基于镜像运行容器。

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > 容器与Kubernetes
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

优先级施加到Pod的调度进程中。应用场景5：在线离线作业混合部署当前很多业务有波峰和波谷，部署服务时，为了保证服务的性能和稳定性，通常会按照波峰时需要的资源申请，但是波峰的时间可能很短，这样在非波峰时段就有资源浪费。另外，由于在线作业SLA要求较高，为了保证服务的性能和可靠性

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
跨账号挂载对象存储 - 云容器引擎 CCE

跨账户数据迁移和备份。例如，账号A即将停用，所有的数据需要迁移至账户B。数据处理与分析。例如，账号B是外部数据处理商，需要访问账户A的原始数据进行大数据分析和机器学习等操作。通过跨账户挂载对象存储，您可以实现数据共享，降低存储和传输成本，同时确保数据的安全性和一致性。这种方式使多个团队或组织能够安全

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
弹性伸缩概述 - 云容器引擎 CCE

么就需要为集群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
安装Spark - 云容器引擎 CCE
安装Spark - 云容器引擎 CCE

安装Spark 前提条件您需要准备一台可访问公网的Linux机器，节点规格建议为4U8G及以上。配置JDK 以CentOS系统为例，安装JDK 1.8。查询可用的JDK版本。 yum -y list java* 选择安装JDK 1.8。 yum install -y java-1

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Spark
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

NPU调度可以指定Pod申请NPU的数量，为工作负载提供NPU资源。 NPU调度 Volcano调度 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
组调度（Gang） - 云容器引擎 CCE

nothing”的调度需求，避免Pod的任意调度导致集群资源的浪费，主要应用于AI、大数据等多任务协作场景。启用该能力后，可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题，大幅度提升整体训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。已安装V

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
使用Kubectl命令操作集群 - 云容器引擎 CCE

使用Kubectl命令操作集群 kubectl kubectl是Kubernetes集群的命令行工具，您可以将kubectl安装在任意一台机器上，通过kubectl命令操作Kubernetes集群。 CCE集群的kubectl安装请参见通过kubectl连接集群。连接后您可以执行kubectl

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > 容器与Kubernetes
通过特权容器功能优化内核参数 - 云容器引擎 CCE

通过特权容器功能优化内核参数前提条件从客户端机器访问Kubernetes集群，需要使用Kubernetes命令行工具kubectl，请先连接kubectl。详情请参见通过kubectl连接集群。操作步骤通过后台创建daemonSet，选择nginx镜像、开启特权容器、配置生命周期、添加hostNetwork:

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
公平调度（DRF） - 云容器引擎 CCE

DRF（Dominant Resource Fairness）是主资源公平调度策略，应用于大批量提交AI训练和大数据作业的场景，可增强集群业务的吞吐量，整体缩短业务执行时间，提高训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
如何查看Pod是否使用CPU绑核？ - 云容器引擎 CCE

s/pod{pod uid}/{容器id}/cpuset.cpus {pod uid}为Pod UID，可在已通过kubectl连接集群的机器上使用以下命令获取： kubectl get po {pod name} -n {namespace} -ojsonpath='{.metadata

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
出口网络带宽保障 - 云容器引擎 CCE

有如下优点：平衡在线业务与离线业务对出口网络带宽的使用，保证在线业务有足够的网络带宽，在线业务触发阈值时，压缩离线业务带宽使用。在线业务所占用的网络资源较少时，离线业务可使用更多带宽；在线业务所占用的网络资源较多时，降低离线业务资源占用量，从而优先保障在线业务的网络带宽。约束与限制

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部

总条数： 85

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Tensorflow训练 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

容器 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

跨账号挂载对象存储 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

安装Spark - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

组调度（Gang） - 云容器引擎 CCE

使用Kubectl命令操作集群 - 云容器引擎 CCE

通过特权容器功能优化内核参数 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

如何查看Pod是否使用CPU绑核？ - 云容器引擎 CCE

出口网络带宽保障 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线