正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
Viewer连接Linux云服务器 Linux云服务器一般采用SSH连接方式,使用密钥对进行安全地无密码访问。但是SSH连接一般都是字符界面,有时需要使用图形界面进行一些复杂操作。本文以Ubuntu 20.04操作系统为例,介绍如何为云服务器安装VNC Server,以及如何使用VNC Viewer连接云服务器。
查询可用区列表:确定待创建云服务器所在的可用区。 查询云服务器规格详情列表:确定待创建云服务器的规格。 查询镜像列表详情:确定待创建云服务器使用的镜像。 查询网络列表:确定云服务器的网络信息。 创建和导入SSH密钥:设置密钥对登录方式。 创建云服务器:创建密钥对登录鉴权的云服务器。 查询云服务器详情:确认云服务器创建成功。
Linux云服务器怎样切换密钥登录为密码登录? 操作场景 本节操作介绍Linux云服务器切换密钥登录为密码登录的操作步骤。 操作步骤 使用密钥登录Linux云服务器,设置root密码。 sudo passwd root 若密钥文件丢失或损坏,请参考Linux云服务器如何进入单用户模式重置root密码,重置root密码。
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
程开启网卡多队列: 将外部镜像文件导入镜像服务控制台。 为私有镜像添加网卡多队列标签。 使用私有镜像创建弹性云服务器。 执行网卡多队列的配置脚本。 云服务器开启网卡多队列功能后,如果后续有新增或删除网卡,切换VPC等操作,需要重新对云服务器设置网卡多队列,详细操作请参考执行网卡多队列的配置脚本。
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
FS。 登录云服务器。 登录弹性云服务器请参见登录弹性云服务器。 登录裸金属服务器请参见登录裸金属服务器。 在云服务器桌面,单击左下方开始图标。 弹出Windows Server窗口。 单击“服务器管理器”,弹出“服务器管理器”窗口。 图12 服务器管理器 “服务器管理器”页面右上方选择“工具
通过移动设备登录Linux ECS 操作场景 本节操作介绍如何在移动设备上连接Linux实例。 以Termius为例介绍如何在iOS设备上连接 Linux 实例,详细操作请参考IOS设备上登录Linux云服务器。 以JuiceSSH为例介绍如何在Android设备上连接 Linux 实例,详
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
高频常见问题 远程登录 如何进行弹性云服务器的一键诊断? 无法登录到Windows云服务器怎么办? 无法登录到Linux云服务器怎么办? 远程登录时需要输入的账号和密码是多少? Windows云服务器如何配置多用户登录? 申请多用户会话授权的license并激活云服务器 云服务器故障/卡顿 Windows云服务器卡顿怎么办?
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
EIP资源绑定的服务器如果对外有攻击等安全违规行为,即被冻结状态,在控制台上显示为冻结(违规冻结)。被冻结的资源不可用,也不能修改、删除。若要解除冻结状态,请提交工单。 您可以参考更换弹性公网IP为实例更换EIP。 EIP绑定的实例涉嫌违规被冻结 EIP资源绑定的服务器涉嫌违规行为
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
在管理控制台创建一个密钥对,绑定至云服务器,使云服务器登录方式切换为密钥。 登录管理控制台。 选择“计算 > 弹性云服务器”,进入云服务器控制台。 参考创建密钥对创建一个密钥对,妥善保管好私钥文件。 选择“服务列表 > 安全 > 数据加密服务”,单击左侧导航中的“密钥对管理”。 选择“云服务器列表”页签
重启网络服务,导致网络短暂不可用。 CentOS 6.x和Debian操作系统的云服务器内部配置IPv6自动获取功能之后,将该云服务器制作为私有镜像,使用该镜像在非IPv6网络环境中创建云服务器时,由于等待获取IPv6地址超时,导致云服务器启动较慢,您可以参考设置云服务器获取IP
调用说明 弹性云服务器提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 父主题: 使用前必读
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile