搜索_华为云

调度算法 - 云容器引擎 CCE
调度算法 - 云容器引擎 CCE

DRF调度算法能够确保在多种类型资源共存的环境下,尽可能满足分配的公平原则。配置建议： DRF调度算法优先考虑集群中业务的吞吐量，适用单次AI训练、单次大数据计算以及查询等批处理小业务场景。组调度将一组Pod看做一个整体进行资源分配。

帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

创建tf-gpu.yaml文件，示例如下：该示例的主要功能是基于Tensorflow的分布式架构，利用卷积神经网络（CNN）中的ResNet50模型对随机生成的图像进行训练，每次训练32张图像（batch_size），共训练100次（step），记录每次训练过程中的性能（image

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

未来Volcano会持续迭代演进，优化算法、增强调度能力如智能调度的支持，在推理场景增加GPU Share等特性的支持，进一步提升kubeflow批量训练和推理的效率。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

对于一个AI算法工程师来讲，如果要做模型训练，就不得不搭建一套AI计算平台，这个过程耗时费力，而且需要很多的知识积累。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

Volcano提供了一个针对BigData和AI场景下，通用、可扩展、高性能、稳定的原生批量计算平台，方便AI、大数据、基因、渲染等诸多行业通用计算框架接入，提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等能力。

帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

应用管理与运维平台（ServiceStage） ServiceStage应用管理与运维平台是一个应用托管和微服务管理平台，可以帮助企业简化部署、监控、运维和治理等应用生命周期管理工作。

帮助中心 > 云容器引擎 CCE > 常见问题 > 相关服务
公平调度（DRF） - 云容器引擎 CCE

公平调度（DRF） DRF（Dominant Resource Fairness）是主资源公平调度策略，应用于大批量提交AI训练和大数据作业的场景，可增强集群业务的吞吐量，整体缩短业务执行时间，提高训练性能。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
组调度（Gang） - 云容器引擎 CCE

启用该能力后，可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题，大幅度提升整体训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。已安装Volcano插件，详情请参见Volcano调度器。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
基于Pod实例画像的资源超卖 - 云容器引擎 CCE

基于Pod实例画像的资源超卖 Volcano新增基于Pod实例画像的超卖量算法。该算法持续采集并累积节点上Pod的CPU和内存利用率，统计Pod资源用量的概率分布特征，进而计算出节点资源用量的概率分布特征，从而在一定的置信度下给出节点资源用量的评估值。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件简介 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
集群成本管理最佳实践 - 云容器引擎 CCE

启用该能力后，可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题，大幅度提升整体训练性能。详情请参见组调度（Gang）。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
调度配置 - 云容器引擎 CCE
调度配置 - 云容器引擎 CCE

DRF调度算法优先考虑集群中业务的吞吐量，适用单次AI训练、单次大数据计算以及查询等批处理小业务场景。启用公平调度（DRF）后，可增强集群业务的吞吐量，提高业务运行性能。详情请参见公平调度（DRF）。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
在CCE集群中部署使用Kubeflow - 云容器引擎 CCE

在CCE集群中部署使用Kubeflow Kubeflow部署 Tensorflow训练使用Kubeflow和Volcano实现典型AI训练任务父主题：批量计算

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
Volcano调度概述 - 云容器引擎 CCE

action中执行的具体算法逻辑取决于注册的plugin中各函数的实现。关闭本次会话。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
Volcano调度器版本发布记录 - 云容器引擎 CCE

queue设置部分capability情况下Pod无法调度问题支持volcano组件日志时间与系统时间保持一致修复队列间多抢占问题修复ioaware插件在某些极端场景下结果不符合预期的问题支持混合集群 1.2.3 v1.15 v1.17 v1.19 修复因为精度不够引发的训练任务

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

将Prometheus监控数据上报至第三方监控平台操作场景 CCE云原生监控插件可以将集群中收集到的Prometheus指标，上报到您指定的监控平台，例如AOM，或者您也可以指定支持Prometheus数据的第三方监控平台。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
弹性伸缩概述 - 云容器引擎 CCE

弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度层弹性，主要是负责修改负载的调度容量变化。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
CCE集群创建时的根证书如何更新？ - 云容器引擎 CCE

CCE集群根证书是Kubernetes认证的基础证书，华为云上的Kubernetes集群管理面托管在CCE管理平台上，证书也在CCE的管理平台上，不对用户开放，这个证书在平台上会定期维护，不会出现过期的情况。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群创建
负载均衡器配置：后端云服务器组 - 云容器引擎 CCE

负载均衡器配置：后端云服务器组后端云服务器组的负载均衡算法服务对接的后端实例会在一个后端云服务器组中，此参数支持配置后端云服务器组的负载均衡算法。

帮助中心 > 云容器引擎 CCE > 配置参考 > 服务
通过控制台创建ELB Ingress - 云容器引擎 CCE

负载均衡配置：分配策略：可选择加权轮询算法、加权最少连接或源IP算法。加权轮询算法：根据后端服务器的权重，按顺序依次将请求分发给不同的服务器。它用相应的权重表示服务器的处理性能，按照权重的高低以及轮询方式将请求分配给各服务器，相同权重的服务器处理相同数目的连接数。

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理

总条数： 122

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调度算法 - 云容器引擎 CCE

Tensorflow训练 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

云容器引擎（CCE）和应用管理与运维平台（ServiceStage）的区别是什么？ - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

组调度（Gang） - 云容器引擎 CCE

基于Pod实例画像的资源超卖 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

集群成本管理最佳实践 - 云容器引擎 CCE

调度配置 - 云容器引擎 CCE

在CCE集群中部署使用Kubeflow - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

Volcano调度器版本发布记录 - 云容器引擎 CCE

将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

CCE集群创建时的根证书如何更新？ - 云容器引擎 CCE

负载均衡器配置：后端云服务器组 - 云容器引擎 CCE

通过控制台创建ELB Ingress - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线