检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU驱动概述 GPU驱动概述 在使用GPU加速型实例前,请确保实例已安装GPU驱动以获得相应的GPU加速能力。 GPU加速型实例支持两种类型的驱动:GRID驱动和Tesla驱动。
Tesla驱动及CUDA工具包获取方式 操作场景 使用GPU加速型云服务器时,需确保已安装Tesla驱动和CUDA工具包,否则无法实现计算加速功能。本节内容提供Tesla驱动及CUDA工具包下载地址,请根据实例的类型,选择具体的驱动版本。
如何收集驱动安装信息 收集驱动安装信息的方法如下: 登录弹性云服务器。 执行以下命令,检查是否禁用了nouveau驱动。
本操作当前仅支持安装Tesla驱动。 如果GPU加速型实例已安装GPU驱动,需要先卸载原驱动后再安装新的目标驱动。 GPU驱动自动安装脚本提供卸载驱动的能力,请在执行脚本时根据交互式界面按需选择。 GPU驱动安装成功后,实例会自动重启。
处理方法 如果未安装GPU驱动,请重新安装GPU驱动。 操作指导请参考:安装GPU驱动 如果已安装驱动,但是驱动被卸载。 执行history,查看是否执行过卸载操作。
如果云服务器已经安装了Tesla驱动,请检查当前驱动版本是否可用。如需安装新版本的驱动请卸载旧版本的Tesla驱动,避免因驱动程序冲突导致安装失败。 如果NVIDIA驱动版本与云服务器不兼容,会导致安装完成后驱动不显示,请参考T4 GPU设备显示异常进行处理。
G系列弹性云服务器GPU驱动故障 问题描述 在Windows系统的G系列弹性云服务器中,无法打开NVIDIA 控制面板,GPU驱动无法使用或GPU驱动显示异常。 可能原因 GPU驱动状态异常。 处理方法 打开Windows设备管理器,在显示适配器中查看GPU驱动状态。
管理GPU加速型ECS的GPU驱动 GPU驱动概述 Tesla驱动及CUDA工具包获取方式 (推荐)自动安装GPU加速型ECS的GPU驱动(Linux) (推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 手动安装GPU加速型ECS的GRID驱动 手动安装GPU加速型
GPU驱动故障 G系列弹性云服务器GPU驱动故障 GPU驱动异常怎么办? GPU驱动不可用 GPU设备显示异常 T4 GPU设备显示异常 GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?
Linux云服务器变更规格时执行驱动安装脚本失败怎么办? 问题描述 变更弹性云服务器规格时,如果使用自动化脚本的方式为Linux云服务器安装驱动。 如果安装过程中出现如下回显信息,说明脚本已经执行完成驱动安装步骤,但在最后检查时失败,可能原因是由于云服务器中缺少某个驱动。
图1 申请试用版License 下载GRID驱动及License软件包 请根据表1对应操作系统下载驱动安装包。 了解更多GRID驱动信息请参考NVIDIA vGPU驱动。 GPU直通型实例:根据需求选择GRID驱动版本。
方法2:查询云服务器安装的驱动版本:whereis nvidia 图4 查询安装的驱动版本 根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是为了执行卸载动作,且后续重新安装驱动时需要此安装包)。
父主题: GPU驱动故障
使用须知 如果GPU加速型实例已安装GPU驱动,需要先卸载原驱动后再安装新的目标驱动。 当前仅部分GPU加速型实例的规格、部分Windows操作系统版本支持通过脚本自动安装GPU驱动。
查看系统日志“/var/log/message”,是否存在驱动相关报错。 如果存在报错“Failed to copy vbios to system memory”,可能是由于频繁加载/卸载驱动导致,建议开启驱动持久化模式,保持驱动处于加载状态。
GPU驱动卸载命令与GPU驱动的安装方式和操作系统类型相关,例如: Windows操作系统卸载驱动 Linux操作系统卸载驱动 Windows操作系统卸载驱动 以Windows Server 2016 数据中心版 64位操作系统为例,介绍GPU加速型云服务器卸载NVIDIA驱动(驱动版本
uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。
方法2:查询云服务器安装的驱动版本:whereis nvidia 图2 查询安装的驱动版本 根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是为了执行卸载动作,且后续重新安装驱动时需要此安装包)。
查看系统日志“/var/log/message”,是否存在驱动相关报错。 如果出现“Failed to copy vbios to system memory”,可能是由于频繁加载/卸载驱动导致,建议开启驱动持久化模式,保持驱动处于加载状态。
lsmod | grep nouveau 如果不存在回显内容或回显中不包含nouveau关键字样,说明Nouveau驱动已禁用。 如果回显信息中包含nouveau关键字样,说明Nouveau驱动已安装,则需要禁用Nouveau驱动。