检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
并对照版本配套关系。 版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。 若显示适配器恢复正常,则恢复完成。 若仍异常,则执行下一步。 请尝试重装GPU驱动或升级驱动版本。请参考安装GPU驱动。 如果
远程连接Windows云服务器报错:出现身份验证错误,要求的函数不受支持 问题描述 Windows操作系统的本地PC,通过RDP协议(如MSTSC方式)远程桌面连接Windows云服务器报错,报错显示出现身份验证错误,要求的函数不受支持。 如果报错信息中仅提示:出现身份验证错误,
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
远程连接Windows云服务器报错:没有远程桌面授权服务器可以提供许可证 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:由于没有远程桌面授权服务器可以提供许可证,远程会话被中断,请跟服务器管理员联系。 图1 没有远程桌面授权服务器可以提供许可证 可能原因
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
远程连接Linux云服务器报错:Disconnected: No supported authentication methods available 问题现象 远程连接Linux云服务器报错:Disconnected: No supported authentication methods
Linux云服务器子网访问异常时出现Invalid argument或者neighbour table overflow异常信息怎么办? 问题现象 用户Linux云服务器向同子网服务器发起请求时,服务端已经收到包,但是没有回包。在服务器端对客户端进行ping操作时返回“sendmsg:
tual disk服务。由于系统内置WinVMDataDiskAutoInitialize.ps1设置开机自启动和客户数据库业务开机自启动时间段重叠了,可能会导致I/O操作错误。 数据库使用Windows API的(例如 ReadFile、 写文件,ReadFileScatter
远程连接Windows云服务器报错:出现身份验证错误,要求的函数不受支持 问题描述 Windows操作系统的本地PC,通过RDP协议(如MSTSC方式)远程桌面连接Windows云服务器报错,报错显示出现身份验证错误,要求的函数不受支持。 如果报错信息中仅提示:出现身份验证错误,
远程连接Windows云服务器报错:此计算机无法连接到远程计算机 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:此计算机无法连接到远程计算机。 图1 无法连接到远程计算机 可能原因 服务端安全组3389端口未开启。检查云服务器端口配置 服务端防火墙关闭。检查防火墙配置是否正常
NetworkManager服务无法启动,报错:Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错:Failed to restart
cursor,本节操作以鲲鹏操作系统CentOS 7.5 64bit操作系统为例。 CentOS 7.5操作系统安装图形化界面操作步骤请参考CentOS 7系列弹性云服务器如何安装图形化界面? 执行以下命令在/etc/X11/xorg.conf.d/目录下增加配置文件20-virtio.conf。 cd
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
远程连接Windows云服务器报错:没有远程桌面授权服务器可以提供许可证 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:由于没有远程桌面授权服务器可以提供许可证,远程会话被中断,请跟服务器管理员联系。 图1 没有远程桌面授权服务器可以提供许可证 可能原因
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
远程连接Windows云服务器报错:为安全考虑,已锁定该用户账户,原因是登录尝试或密码更改尝试过多 问题描述 使用远程登录方式连接Windows云服务器时提示“为安全考虑,已锁定该用户账户,原因是登录尝试或密码更改尝试过多”错误,具体报错信息如下图所示。 可能原因 Windows
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile