搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

到2个GPU。但是TFJob1和TFJob2均需要4块GPU卡才能运行起来。这样TFJob1和TFJob2处于互相等待对方释放资源，这种死锁情况造成了GPU资源的浪费。亲和调度问题分布式训练中，Ps和Worker存在很频繁的数据交互，所以Ps和Worker之间的带宽直接影响了训练的效率。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布应用服务网格（Application Service Mesh，简称ASM）是基于开源Istio推出的服务网格平台，它深度、无缝对接了企业级Kubernetes集群服务云容器引擎（CCE），在易用性、可靠性、可视化等方面进行了一系列增强，可为客户提供开箱即用的上手体验。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
亲和与反亲和调度 - 云容器引擎 CCE

节点亲和的规则只能影响Pod和节点之间的亲和，Kubernetes还支持Pod和Pod之间的亲和，例如将应用的前端和后端部署在一起，从而减少访问延迟。Pod亲和同样有requiredDuringSchedulingIgnoredDuringExecution和preferredDur

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Pod的编排与调度
NPU调度 - 云容器引擎 CCE
NPU调度 - 云容器引擎 CCE

使用huawei.com/ascend-310参数指定NPU数量时，requests和limits值需要保持一致。指定huawei.com/ascend-310后，在调度时不会将负载调度到没有NPU的节点。如果缺乏NPU资源，会报类似“0/2 nodes are available: 2

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
使用Kubernetes默认GPU调度 - 云容器引擎 CCE

GPU只会分配到一张卡上。使用nvidia.com/gpu参数指定GPU数量时，requests和limits值需要保持一致。指定nvidia.com/gpu后，在调度时不会将负载调度到没有GPU的节点。如果缺乏GPU资源，会报类似如下的Kubernetes事件。 0/2 nodes are available:

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

选择“自定义规格”时，您可根据需求调整插件实例数和资源配额。实例数为1时插件不具备高可用能力，当插件实例所在节点异常时可能导致插件功能无法正常使用，请谨慎选择。其中volcano-admission组件的资源配额设置与集群节点和Pod规模无关，可保持默认值。而volcano-controller和volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

在支持AI，大数据等作业的时候提供了高精度的资源调度策略，例如在深度学习场景下计算效率非常重要。以TensorFlow计算为例，配置“ps”和“worker”之间的亲和性，以及“ps”与“ps”之间的反亲和性，可使“ps”和“worker”尽量调度到同一台节点上，从而提升“ps”和“worker”之间进行网络和数

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
云原生网络2.0模型说明 - 云容器引擎 CCE

要进行隧道封装和NAT转换，所以适用于对带宽、时延要求极高的业务场景，比如：线上直播、电商抢购等。大规模组网：云原生网络2.0当前最大可支持2000个ECS节点，10万个Pod。容器IP地址管理云原生网络2.0下的BMS节点和ECS节点分别使用的是弹性网卡和辅助弹性网卡：

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > 云原生网络2.0模型
管理节点污点 - 云容器引擎 CCE

在弹出的窗口中，在“批量操作”下方单击“新增批量操作”，然后选择“添加/更新”或“删除”，选择“K8S 污点(Taints)”。填写需要操作污点的“键”和“值”，选择污点的效果，单击“确定”。图1 添加污点污点添加成功后，再次进入该界面，在节点数据下可查看到已经添加的污点。通过kubectl命令管理污点

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布本文将介绍使用Nginx Ingress实现灰度发布和蓝绿发布的应用场景、用法详解及实践步骤。应用场景使用Nginx Ingress实现灰度发布适用场景主要取决于业务流量切分的策略，目前Nginx Ingress支持基于H

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
工作负载调度策略概述 - 云容器引擎 CCE

节点亲和可以实现nodeSelector的能力，但其表达能力更强，您可以根据节点上的标签，使用标签选择器来筛选需要亲和的节点，支持必须满足和尽量满足的亲和性规则。说明：如果同时指定nodeSelector和nodeAffinity，则两者必须都要满足，才能将Pod调度到候选节点上。设置节点亲和调度（nodeAffinity）

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 调度工作负载
Volcano调度概述 - 云容器引擎 CCE

Scheduler是负责Pod调度的组件，它由一系列action和plugin组成。action定义了调度各环节中需要执行的动作；plugin根据不同场景提供了action 中算法的具体实现细节。Volcano Scheduler具有高度的可扩展性，您可以根据需要实现自己的action和plugin。图1 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
工作负载异常：实例调度失败 - 云容器引擎 CCE

表示Pod亲和不满足。 pod affinity/anti-affinity 表示Pod亲和/反亲和不满足。解决方案：在设置“工作负载间的亲和性”和“工作负载和节点的亲和性”时，需确保不要出现互斥情况，否则工作负载会部署失败。若工作负载配置了节点亲和性，需确保亲和的节点标签中supportC

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
存储概述 - 云容器引擎 CCE
存储概述 - 云容器引擎 CCE

缩至PB规模，具备高可用性和持久性，为海量数据、高带宽型应用提供有力支持。适用于多种应用场景，包括HPC、媒体处理、文件共享、内容管理和Web服务等。 SFS Turbo为用户提供一个完全托管的共享文件存储，能够弹性伸缩至320TB规模，具备高可用性和持久性，为海量的小文件、低延

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储
VPC网络模型说明 - 云容器引擎 CCE

的可用IP数和集群规模的影响，详情请参见网段规划建议。网段规划建议在集群网络构成中介绍集群中网络地址可分为集群网络、容器网络、服务网络三块，在规划网络地址时需要从如下方面考虑：三个网段不能重叠，否则会导致冲突。且集群所在VPC下所有子网（包括扩展网段子网）不能和容器网段、服务网段冲突。

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > VPC网络模型
什么是云容器引擎 - 云容器引擎 CCE

云原生网络1.0：面向性能和规模要求不高的场景。容器隧道网络模式 VPC网络模式云原生网络2.0：面向大规模和高性能的场景。组网规模最大支持2000节点云原生网络2.0：面向大规模和高性能的场景。网络性能 VPC网络叠加容器网络，性能有一定损耗 VPC网络和容器网络融合，性能无损耗

 帮助中心 > 云容器引擎 CCE > 产品介绍
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸载您自建的Pro

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
存储Flexvolume概述 - 云容器引擎 CCE

容器存储是为容器工作负载提供存储的组件，支持多种类型的存储，同一个工作负载（pod)可以使用任意数量的存储。云容器引擎CCE的容器存储功能基于Kubernetes存储系统，并深度融合云存储服务，完全兼容Kubernetes原生的存储服务，例如EmptyDir、HostPath、Secret、ConfigMap等存储。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用）
修改CCE集群配置 - 云容器引擎 CCE

32767的TCP/UDP端口范围，否则除默认端口外的其他端口将无法被外部访问。端口号小于20106会和CCE组件的健康检查端口冲突，引发集群不可用；端口号高于32767会和net.ipv4.ip_local_port_range范围冲突，影响性能。默认：30000-32767

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群

总条数： 463

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

亲和与反亲和调度 - 云容器引擎 CCE

NPU调度 - 云容器引擎 CCE

使用Kubernetes默认GPU调度 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

云原生网络2.0模型说明 - 云容器引擎 CCE

管理节点污点 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

工作负载调度策略概述 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

工作负载异常：实例调度失败 - 云容器引擎 CCE

存储概述 - 云容器引擎 CCE

VPC网络模型说明 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

存储Flexvolume概述 - 云容器引擎 CCE

修改CCE集群配置 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线