搜索_华为云

执行磁盘初始化脚本后，Oralce、MySQL和SQL Server等数据库系统日志出现Msg 823错误怎么办？ - 弹性云服务器 ECS

坏时用户可能会遇到此错误。处理方法登录弹性云服务器，打开运行对话框，输入“services.msc”并按回车键，查看Windows系统的服务。查找virtual disk服务，并确保virtual disk服务停止状态。图1 查看virtual disk服务状态如果virtual

帮助中心 > 弹性云服务器 ECS > 常见问题 > 应用搭建及软件安装咨询
可用区之间的数据传输是否需要收费？ - 弹性云服务器 ECS

可用区之间的数据传输是否需要收费？同一区域下的可用区不收费，跨区域的可用区则需要收费。父主题：区域与可用区

 帮助中心 > 弹性云服务器 ECS > 常见问题 > 区域与可用区
Windows 2012系统卸载某些软件后无法进入系统桌面怎么办？ - 弹性云服务器 ECS

5后，系统由完整模式Full变为了核心模式Core，没有启用系统桌面。处理方法恢复过程就是由核心模式切换到完整模式的过程，步骤如下：登录弹性云服务器。单击右上角的“Send CtrlAltDel”按钮，打开任务管理器。选择“文件 > 运行新任务”。系统打开“新建任务”窗口。图1

帮助中心 > 弹性云服务器 ECS > 常见问题 > 远程登录 > 远程连接类
如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

couldn't communicate with the NVIDIA diver。判断方式执行以下命令，查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令，查看安装驱动时的内核版本。 CentOS：find /usr/lib/modules -name nvidia

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
Linux镜像安装一键式重置密码插件启动失败怎么办？ - 弹性云服务器 ECS

at step EXEC spawning /CloudrResetPwdAgent/bin/./cloudResetPwdAgent.script: Permission denied systemd[1]: cloudResetPwdAgent.service: Control process

帮助中心 > 弹性云服务器 ECS > 常见问题 > 密码与密钥对
如何处理显卡ERR！问题 - 弹性云服务器 ECS

示ERR！处理方法如果当前用户业务正常，仅nvidia-smi执行后存在ERR!显示问题，无需处理。如果当前业务已经受到影响，迁移虚拟机，再根据故障信息收集收集故障信息后联系技术支持处理。父主题：非硬件故障自恢复处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

确认用户业务使用场景是否是做图形处理，用户使用的实例规格是否满足图形处理要求。用户是否安装GRID驱动，执行nvidia-smi命令查询回显是否正常。如果回显正常，且能查询到驱动版本，驱动版本是GRID驱动的版本，则说明已安装GRID驱动。用户是否购买了License，如果已购买License是否已经配置了License。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如果用户使用的是私有镜像或其他镜像，可通过nvidia-smi命令查询是否安装了驱动以及确认驱动类型、驱动版本。如客户选择自行安装Tesla驱动，请务必告知客户确保Tesla驱动与CUDA软件的版本配套关系，可参考Tesla驱动及CUDA工具包获取方式。处理方法如果用户未安装驱动，请自行安

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

执行以下命令，查看内核版本，检查内核版本是否一致。 rpm -qa | grep gcc #查看gcc版本 rpm -qa | grep kernel-devel #查看kernel-devel版本如果内核版本不一致，请重装驱动。如果内核版本一致，则执行下一步。查看dmesg日志，检查是否存在NVRM报错。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题问题描述用户在Windows设备管理器显示适配器中查询显卡属性，发现设备状态中存在错误“由于该设备有问题，Windows已将其停止”。判断方式确认用户发生问题时的操作，是否有出现显存OOM。如果

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

执行nvidia-smi命令，查看风扇是否正常。如果风扇转速为0，说明风扇可能存在损坏，用户停止业务，执行业务迁移后，根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题。如果风扇显示ERR!，可能是因为显卡过热，用户先停止业务，待显卡缓解过热后再执行nvidia-smi命令，查看ERR!是否消失。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错问题原因 XID 说明 32 Invalid or corrupted push buffer stream，推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID，表明GPU硬件故障需要下线维修。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令查看显卡信息。如果在volatile Uncorr. ECC下发现存在ecc error，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。如果在volatile Uncorr. ECC下未发现ecc

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？可以，但是不建议这种部署方式。建议将一个应用软件内的不同部件部署到同一个区域，这样不同部件之间的通信可以采用内网网络通信，既可以节省因采用公网网络通信带来的带宽费用，又可以保证不同部件之间的网络通信质量。父主题：

帮助中心 > 弹性云服务器 ECS > 常见问题 > 区域与可用区
如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题问题描述用户使用不带驱动的公共镜像或私有镜像，自行安装NVIDIA驱动软件包、CUDA软件包，在安装过程中脚本执行报错。判断方式确认用户使用的镜像文件。确认用户的NVIDIA软件包来源。确认用户想要的

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令，查看显卡信息。如果在volatile Uncorr. ECC下ecc error > 0，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。如果在volatile Uncorr. ECC下ecc

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错：Failed to restart

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因某种健全性检查没有通过，GPU驱动程序不会使用或信任其内容（某些内容未被使用）。问题影响可能影响ECC相关非易失数据的记录，从而导致本该隔离的GPU内存页面继续使用。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法

总条数： 1198

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行磁盘初始化脚本后，Oralce、MySQL和SQL Server等数据库系统日志出现Msg 823错误怎么办？ - 弹性云服务器 ECS

可用区之间的数据传输是否需要收费？ - 弹性云服务器 ECS

Windows 2012系统卸载某些软件后无法进入系统桌面怎么办？ - 弹性云服务器 ECS

如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

Linux镜像安装一键式重置密码插件启动失败怎么办？ - 弹性云服务器 ECS

如何处理显卡ERR！问题 - 弹性云服务器 ECS

如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线