搜索_华为云

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 Kubernetes已经成为云原生应用编排、管理的事实标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用Kubernet

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）版本发布记录表1 CCE AI套件（NVIDIA GPU）版本记录插件版本支持的集群版本更新特性 2.7.42 v1.28 v1.29 v1.30 v1.31 新增NVIDIA 535.216.03驱动，支持XGPU特性 2.7.41

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
AI任务性能增强调度 - 云容器引擎 CCE

AI任务性能增强调度公平调度（DRF）组调度（Gang）父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

CCE AI套件（Ascend NPU）版本发布记录表1 CCE AI套件（Ascend NPU）插件版本记录插件版本支持的集群版本更新特性 2.1.46 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件介绍 CCE AI套件（NVIDIA GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。字段说明表1 参数描述参数是否必选参数类型描述 basic 是 object 插件基础配置参数。

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）插件简介 CCE AI套件（NVIDIA GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。约束与限制下载的驱动必须是后缀为“.run”的文件。仅支持Nvidia Tesla驱动，不支持GRID驱动。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

container_path 否 String 容器里用于挂载Hiai library的路径默认值："/usr/local/HiAI_unused" host_path 否 String 主机上包含Hiai library的路径默认值："/usr/local/HiAI_unused"

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

CCE AI套件（Ascend NPU）插件简介 CCE AI套件（Ascend NPU）是支持容器里使用huawei NPU设备的管理插件。安装本插件后，可创建“AI加速型”节点，实现快速高效地处理推理和图像识别等工作。约束与限制集群中使用“AI加速型”节点时必须安装CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

Device=%s, UUID=%s, SN=%s failed to get fan state. GPU设备存在风扇异常不隔离 GPUHealthWarning Device=%s, UUID=%s, SN=%s failed to get power state. GPU设备存在功率查询异常

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
Container配置 - 云容器引擎 CCE
Container配置 - 云容器引擎 CCE

Container配置容器名称参数名取值范围默认值是否允许修改作用范围 name 无无允许 - 镜像名称参数名取值范围默认值是否允许修改作用范围 image 无无允许 - 更新策略参数名取值范围默认值是否允许修改作用范围 imagePullPolicy

帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
K8s废弃API检查异常处理 - 云容器引擎 CCE

K8s废弃API检查异常处理检查项内容系统会扫描过去一天的审计日志，检查用户是否调用目标K8s版本已废弃的API。由于审计日志的时间范围有限，该检查项仅作为辅助手段，集群中可能已使用即将废弃的API，但未在过去一天的审计日志中体现，请您充分排查。解决方案检查说明根据检查结果，检测到您的集群通过

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理检查项内容检查当前集群内使用containerd的节点在升级containerd组件时，节点上运行的业务容器是否可能发生重启，造成业务影响。解决方案检测到您的节点上的containerd服务存在重启风险；请确保在业务影响可控

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
错误码 - 云容器引擎 CCE
错误码 - 云容器引擎 CCE

请使用支持ipv6的子网。 400 CCE.01400004 No available flavors for master nodes. Master节点无可用规格。请更换其他可用的集群规格，或联系技术支持。 400 CCE.01400005 Container network CIDR blocks

帮助中心 > 云容器引擎 CCE > API参考 > 附录
CCE Turbo集群正式发布，敬请购买使用 - 云容器引擎 CCE

发布时间：2021/03/31 CCE Turbo集群是全面基于云原生基础设施构建的云原生2.0的容器引擎服务，具备软硬协同、网络无损、安全可靠、调度智能的优势，为用户提供一站式、高性价比的全新容器服务体验。详情请参见购买CCE集群。父主题：产品变更公告

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品变更公告
NVIDIA Container Toolkit容器逃逸漏洞公告（CVE-2024-0132） - 云容器引擎 CCE

0，则不涉及该漏洞。 CCE AI套件（NVIDIA GPU）插件老版本命名为：gpu-beta、gpu-device-plugin。如果CCE AI套件（NVIDIA GPU）插件版本大于等于2.0.0，请登录GPU节点执行以下命令： nvidia-container-runtime

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
节点干扰ContainerdSock检查异常处理 - 云容器引擎 CCE

Euler-docker。执行stat /run/containerd/containerd.sock命令，若发现存在该文件则会导致docker启动失败。执行rm -rf /run/containerd/containerd.sock命令，然后重新进行集群升级检查。父主题：

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Apache containerd安全漏洞公告（CVE-2020-15257） - 云容器引擎 CCE

Apache containerd安全漏洞公告（CVE-2020-15257）漏洞详情 CVE-2020-15257是containerd官方发布的一处Docker容器逃逸漏洞。containerd是一个支持Docker和常见Kubernetes配置的容器运行时管理组件，它处理

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
containerd容器进程权限提升漏洞公告（CVE-2022-24769） - 云容器引擎 CCE

4.1-98版本的containerd作为kuberentes CRI运行时。 2. CCE集群containerd版本低于1.5.11以下的集群。判断方法在node节点上使用root用户执行containerd --version查看containerd版本。新Conso

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

CCE Turbo集群支持管理边缘基础设施（智能边缘小站）的能力。启用分布式支持后，一个集群可以统一管理数据中心和边缘的计算资源，用户可以便捷地根据应用的诉求将其部署在对应的区域。 CCE Turbo集群使用分布式云资源功能需要提前注册并部署智能边缘小站服务。图1 CCE Turbo分布式管理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 购买集群
将节点容器引擎从Docker迁移到Containerd - 云容器引擎 CCE

迁移的影响，以最大限度避免可能存在的风险。 Containerd不具备镜像构建功能，请勿在Containerd节点上使用Docker Build功能构建镜像。Docker和Containerd其他差异请参考容器引擎说明。默认节点池中的节点迁移步骤登录CCE控制台，单击集群名称进入集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维

总条数： 620

上一页
1
2
3
4
5
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU）版本发布记录 - 云容器引擎 CCE

AI任务性能增强调度 - 云容器引擎 CCE

CCE AI套件（Ascend NPU）版本发布记录 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

Container配置 - 云容器引擎 CCE

K8s废弃API检查异常处理 - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

错误码 - 云容器引擎 CCE

CCE Turbo集群正式发布，敬请购买使用 - 云容器引擎 CCE

NVIDIA Container Toolkit容器逃逸漏洞公告（CVE-2024-0132） - 云容器引擎 CCE

节点干扰ContainerdSock检查异常处理 - 云容器引擎 CCE

Apache containerd安全漏洞公告（CVE-2020-15257） - 云容器引擎 CCE

containerd容器进程权限提升漏洞公告（CVE-2022-24769） - 云容器引擎 CCE

在CCE Turbo集群中使用分布式云资源 - 云容器引擎 CCE

将节点容器引擎从Docker迁移到Containerd - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线