检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。 处理方法 推荐客户使用自动安装驱动
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
到host_list.txt文件中。 文件填写格式与登录待切换弹性云服务器的方式需要匹配。 使用密钥对方式鉴权的云服务器,填写方式如下: 使用密钥对方式鉴权的云服务器,请将创建弹性云服务器时保存的私钥文件,上传至与host_list.txt同一个文件夹下。 使用密钥对方式鉴权的云服务器,请确保私钥文件的权限为400。
获取VNC远程登录地址(微版本2.6及以上)(废弃) 功能介绍 获取弹性云服务器VNC远程登录地址。 当前API已废弃,请使用获取VNC远程登录地址。 URI POST /v2.1/{project_id}/servers/{server_id}/remote-consoles 参数说明请参见表1。
远程连接Windows云服务器报错:出现身份验证错误,要求的函数不受支持 问题描述 Windows操作系统的本地PC,通过RDP协议(如MSTSC方式)远程桌面连接Windows云服务器报错,报错显示出现身份验证错误,要求的函数不受支持。 如果报错信息中仅提示:出现身份验证错误,
输入“脚本名称”,并将步骤1下载的脚本文件复制到“脚本内容”区域。 对于Windows操作系统的弹性云服务器,需将“脚本内容”的格式切换为“Bat”。 手动替换脚本中下载地址,下载对应操作系统架构的一键式重置密码插件包。 仅未绑定弹性公网IP的弹性云服务器需要执行本步骤。若待更新的弹性云服务器均已绑定弹性公网IP,则跳过本步骤,无需操作。
methods available 可能原因 SSH服务端配置了禁止密码验证登录的策略。 处理方法 编辑 /etc/ssh/sshd_config 文件,检查如下设置 vi /etc/ssh/sshd_config 修改如下配置项: 把PasswordAuthentication no 改为
在执行完步骤7之后可以解绑eip。 约束与限制 需要选取一台操作系统为CentOS 8.2 (公共镜像)且已绑定弹性公网IP的云服务器作为执行机,且与待批量安装插件的弹性云服务器之间网络需要互通。 若已配置yum内部源,可不需要绑定弹性公网IP。 操作步骤 以root用户登录执行机。 执行以下命令,安装批量脚本运行所需要的依赖。
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? 可以,但是不建议这种部署方式。 建议将一个应用软件内的不同部件部署到同一个区域,这样不同部件之间的通信可以采用内网网络通信,既可以节省因采用公网网络通信带来的带宽费用,又可以保证不同部件之间的网络通信质量。 父主题:
远程连接Windows云服务器报错:出现身份验证错误,要求的函数不受支持 问题描述 Windows操作系统的本地PC,通过RDP协议(如MSTSC方式)远程桌面连接Windows云服务器报错,报错显示出现身份验证错误,要求的函数不受支持。 如果报错信息中仅提示:出现身份验证错误,
远程连接Windows云服务器报错:此计算机无法连接到远程计算机 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:此计算机无法连接到远程计算机。 图1 无法连接到远程计算机 可能原因 服务端安全组3389端口未开启。检查云服务器端口配置 服务端防火墙关闭。检查防火墙配置是否正常
远程连接Windows云服务器报错:没有远程桌面授权服务器可以提供许可证 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:由于没有远程桌面授权服务器可以提供许可证,远程会话被中断,请跟服务器管理员联系。 图1 没有远程桌面授权服务器可以提供许可证 可能原因
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
NetworkManager服务无法启动,报错:Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错:Failed to restart
并对照版本配套关系。 版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。 若显示适配器恢复正常,则恢复完成。 若仍异常,则执行下一步。 请尝试重装GPU驱动或升级驱动版本。请参考安装GPU驱动。 如果
远程连接Windows云服务器报错:两台计算机无法在分配的时间内连接 问题描述 本地主机远程桌面连接云服务器时报错提示:两台计算机无法在分配的时间内连接。 图1 两台计算机无法在分配的时间内连接 解决方法 在本地主机单击“开始”,运行中输入cmd,用管理员身份运行cmd。 然后输入命令
远程连接Windows云服务器报错:没有远程桌面授权服务器可以提供许可证 问题描述 使用远程登录方式连接登录Windows云服务器时出现如下错误:由于没有远程桌面授权服务器可以提供许可证,远程会话被中断,请跟服务器管理员联系。 图1 没有远程桌面授权服务器可以提供许可证 可能原因
远程连接Windows云服务器报错:两台计算机无法在分配的时间内连接 问题描述 本地主机远程桌面连接云服务器时报错提示:两台计算机无法在分配的时间内连接。 图1 两台计算机无法在分配的时间内连接 解决方法 在本地主机单击“开始”,运行中输入cmd,用管理员身份运行cmd。 然后输入命令
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。