搜索_华为云

Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

该示例的主要功能是基于Tensorflow的分布式架构，利用卷积神经网络（CNN）中的ResNet50模型对随机生成的图像进行训练，每次训练32张图像（batch_size），共训练100次（step），记录每次训练过程中的性能（image/sec）。 apiVersion: "kubeflow.org/v1" kind:

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

本机网络提供传输效率，缩短训练时间。 Volcano批量调度系统：加速AI计算的利器 Volcano是一款构建于Kubernetes之上的增强型高性能计算任务批量处理系统。作为一个面向高性能计算场景的平台，它弥补了Kubernetes在机器学习、深度学习、HPC、大数据计算等场景

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
docker审计日志量过大影响磁盘IO如何解决？ - 云容器引擎 CCE

docker审计日志量过大影响磁盘IO如何解决？问题描述部分集群版本的存量节点docker审计日志量较大，由于操作系统内核缺陷，会低概率出现IO卡住。该问题可通过优化审计日志规则，降低问题出现的概率。影响范围受影响的集群版本： v1.15.11-r1 v.1.17.9-r0

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

署、使用和管理当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发、构建、训练、部署四个环节，可全面支持企业用户的机器学习、深度学习完整使用过程。如下图所示：通过Kubeflow 1.0，用户可以使用Jupyter开发模型，然后使用fairing（S

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
弹性伸缩概述 - 云容器引擎 CCE

群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度层弹性，主

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件简介 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。 Volcano提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
云容器引擎CCE如何定价/收费？ - 云容器引擎 CCE

其他云服务资源：集群所使用的IaaS基础设施费用，包括集群创建使用过程中自动创建或手动加入的相关资源，如云服务器、云硬盘、弹性IP/带宽、负载均衡等，价格参照相应产品价格表。更多价格目录请参见：产品价格详情。如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程，请参见计费样例。父主题：计费类

 帮助中心 > 云容器引擎 CCE > 常见问题 > 计费类
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
构造请求 - 云容器引擎 CCE
构造请求 - 云容器引擎 CCE

构造请求本节介绍REST API请求的组成，并以调用IAM服务的获取用户Token说明如何调用API，该API获取用户的Token，Token可以用于调用其他API时鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987。

帮助中心 > 云容器引擎 CCE > API参考 > 如何调用API
什么是云容器引擎 - 云容器引擎 CCE

根据业务需求和策略，经济地自动调整弹性计算资源的管理服务。服务治理：深度集成应用服务网格，提供开箱即用的应用服务网格流量治理能力，用户无需修改代码，即可实现灰度发布、流量治理和流量监控能力。容器运维：深度集成容器智能分析，可实时监控应用及资源，支持采集、管理、分析日志，采集各项指标及事件并提供一键开启的告警能力。

帮助中心 > 云容器引擎 CCE > 产品介绍
目标集群资源规划 - 云容器引擎 CCE

VPC网络：采用VPC路由方式与底层网络深度整合，适用于高性能场景，节点数量受限于虚拟私有云VPC的路由配额。容器隧道网络（Overlay）：基于底层VPC网络，另构建了独立的VXLAN隧道化容器网络，适用于一般场景。云原生2.0：深度整合弹性网卡（Elastic Network

帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
节点规格说明 - 云容器引擎 CCE

125TFLOPS Tensor Core 深度学习加速 300GiB/s NVLINK 机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。 CCE Standard集群推理加速型 Pi2ne NVIDIA T4（GPU直通） 2560 8.1TFLOPS

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
组调度（Gang） - 云容器引擎 CCE

组调度（Gang）组调度（Gang）满足了调度过程中“All or nothing”的调度需求，避免Pod的任意调度导致集群资源的浪费，主要应用于AI、大数据等多任务协作场景。启用该能力后，可以解决分布式训练任务之间的资源忙等待和死锁等痛点问题，大幅度提升整体训练性能。前提条件已创建v1.1

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
通过kubectl连接集群 - 云容器引擎 CCE

本文将以CCE Standard集群为例，介绍如何通过kubectl连接CCE集群。权限说明 kubectl访问CCE集群是通过集群上生成的配置文件（kubeconfig）进行认证，kubeconfig文件内包含用户信息，CCE根据用户信息的权限判断kubectl有权限访问哪些Kuber

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 连接集群
公平调度（DRF） - 云容器引擎 CCE

DRF（Dominant Resource Fairness）是主资源公平调度策略，应用于大批量提交AI训练和大数据作业的场景，可增强集群业务的吞吐量，整体缩短业务执行时间，提高训练性能。前提条件已创建v1.19及以上版本的集群，详情请参见购买Standard/Turbo集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸载您自建的Pro

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
暂停集群升级任务（已废弃） - 云容器引擎 CCE

暂停集群升级任务。集群升级涉及多维度的组件升级操作，强烈建议统一通过CCE控制台执行交互式升级，降低集群升级过程的业务意外受损风险；当前集群升级相关接口受限开放。调用方法请参见如何调用API。 URI POST /api/v3/projects/{project_id}/clust

帮助中心 > 云容器引擎 CCE > API参考 > API > 集群升级
存储Flexvolume概述 - 云容器引擎 CCE

r）后，原有功能保持不变，但请注意不要新建Flexvolume插件（storage-driver）的存储，否则将导致部分存储功能异常。如何判断集群的存储插件模式登录CCE控制台。在控制台左侧栏目树中，单击“插件中心”。在右侧的插件管理列表中，单击“插件实例”页签。在插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用）
修改CCE集群配置 - 云容器引擎 CCE

修改CCE集群配置操作场景 CCE支持对集群配置参数进行管理，通过该功能您可以对核心组件进行深度配置。操作步骤登录CCE控制台，在左侧导航栏中选择“集群管理”。找到目标集群，查看集群的更多操作，并选择“配置管理”。图1 配置管理在侧边栏滑出的“配置管理”窗口中，根据业

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Tensorflow训练 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

docker审计日志量过大影响磁盘IO如何解决？ - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

云容器引擎CCE如何定价/收费？ - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

构造请求 - 云容器引擎 CCE

什么是云容器引擎 - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

节点规格说明 - 云容器引擎 CCE

组调度（Gang） - 云容器引擎 CCE

通过kubectl连接集群 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

暂停集群升级任务（已废弃） - 云容器引擎 CCE

存储Flexvolume概述 - 云容器引擎 CCE

修改CCE集群配置 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线