搜索_华为云

GPU节点使用nvidia驱动启动容器排查思路 - 云容器引擎 CCE

查看nvidia驱动运行是否正常。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

CCE推荐的GPU驱动版本列表对于CCE集群，各系统推荐使用驱动版本如下表，若使用非CCE推荐驱动版本，需要您自行验证机型、系统及驱动版本间的配套兼容性。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
EulerOS 2.9系统安装NVIDIA驱动失败 - 云容器引擎 CCE

问题定位当安装GPU驱动出错时，可以通过以下命令查询驱动日志，从而确定报错原因。 cat /var/log/nvidia-installer.log 若回显中存在以下内容，则说明未安装GPU驱动的相关依赖项。 ...

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
GPU节点驱动版本 - 云容器引擎 CCE

GPU节点驱动版本选择GPU节点驱动版本 CCE推荐的GPU驱动版本列表手动更新GPU节点驱动版本通过节点池升级节点的GPU驱动版本父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
手动更新GPU节点驱动版本 - 云容器引擎 CCE

手动更新GPU节点驱动版本一般情况下，您可以通过CCE AI套件（NVIDIA GPU）插件配置节点的驱动文件路径，节点重启后会自动安装驱动。您也可以手动更新驱动的方式进行更新。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
选择GPU节点驱动版本 - 云容器引擎 CCE

在选择Nvidia驱动时，建议您在满足下表中CUDA版本和驱动版本配套关系的前提下，优先选择CCE推荐的GPU驱动版本列表中提供的GPU驱动版本。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
Ubuntu内核与GPU驱动兼容性提醒 - 云容器引擎 CCE

当Ubuntu内核版本在5.15.0-113-generic上时，GPU插件必须使用535.161.08及以上的驱动版本。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

通过节点池升级存量节点的NVIDIA驱动，本质上是在重启节点的过程中重新安装驱动，因此请务必在升级驱动前确认节点上不存在正在运行的任务。步骤一：指定节点池驱动版本登录节点查看节点上实际的驱动版本。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

如果节点驱动版本为450系列，请升级驱动至450.102.04版本。如果节点驱动版本为460系列，请升级驱动至460.32.03版本。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
NPU插件从1.x.x升级到2.x.x后Pod无法启动如何解决？ - 云容器引擎 CCE

npu-smi 您需要在业务容器中手动挂载驱动以及npu-smi 驱动版本 >= 23.0.rc0 您需要在业务容器中手动挂载驱动以及npu-smi 插件可以在业务容器中自动挂载驱动，但是无法挂载npu-smi 插件可以在业务容器中自动挂载驱动以及npu-smi 解决方案使用2.

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

获取驱动链接方法请参考获取驱动链接-公网地址。若下载链接为OBS上的链接，无需绑定EIP 。获取驱动链接方法请参考获取驱动链接-OBS地址。请确保Nvidia驱动版本与GPU节点适配。配套关系请参见GPU驱动支持列表。更改驱动版本后，需要重启节点才能生效。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生AI插件
CCE AI套件（NVIDIA GPU）插件检查异常处理 - 云容器引擎 CCE

解决方案由于当前CCE AI套件（NVIDIA GPU）插件的驱动配置由您自行配置，需要您验证两者的兼容性。建议您在测试环境验证安装升级目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
使用Kubernetes默认GPU调度 - 云容器引擎 CCE

集群中需要安装CCE AI套件（NVIDIA GPU）插件，且安装时注意要选择节点上GPU型号对应的驱动，具体请参见CCE AI套件（NVIDIA GPU）。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow 资源准备购买CCE集群，购买GPU节点并使用gpu-beta插件安装显卡驱动。在集群下添加一个对象存储卷。数据预置从https://github.com/zalandoresearch/fashion-mnist下载数据。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
如何配置Pod使用GPU节点的加速能力？ - 云容器引擎 CCE

解答方案1：建议您将集群中GPU节点的不可调度的污点去掉，以便GPU插件驱动能够正常安装，同时您需要安装高版本的GPU驱动。如果您的集群中有非GPU的容器，可以通过亲和、反亲和策略将这个容器不调度到GPU节点上。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
CCE容器存储（Flexvolume，已废弃） - 云容器引擎 CCE

CCE容器存储（Flexvolume，已废弃）插件简介 CCE容器存储（FlexVolume），即storage-driver，是一款云存储驱动插件，北向遵循标准容器平台存储驱动接口。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器存储插件
资源准备 - 云容器引擎 CCE
资源准备 - 云容器引擎 CCE

Nvidia驱动：填写Nvidia驱动的下载链接，请根据GPU节点的显卡型号选择驱动。其余参数可保持默认，详情请参见gpu-beta（gpu-device-plugin）。单击“安装”，安装插件的任务即可提交成功。创建GPU节点。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
（停止维护）Kubernetes 1.19版本说明 - 云容器引擎 CCE

资源变更与弃用社区1.19 ReleaseNotes 增加对vSphere in-tree卷迁移至vSphere CSI驱动的支持。in-tree vSphere Volume插件将不再使用，并在将来的版本中删除。

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
（停止维护）Kubernetes 1.19版本说明 - 云容器引擎 CCE

资源变更与弃用社区1.19 ReleaseNotes 增加对vSphere in-tree卷迁移至vSphere CSI驱动的支持。in-tree vSphere Volume插件将不再使用，并在将来的版本中删除。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群版本发布说明 > Kubernetes版本发布记录
使用Spark on CCE - 云容器引擎 CCE

使用spark-submit提交Spark应用程序的工作原理如下：创建一个Pod，用于运行Spark的驱动程序。驱动程序在集群中创建执行程序的Pod并与其建立连接，用于执行应用程序代码。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Spark

总条数： 616

上一页
1
2
3
4
5
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消