搜索_华为云

为什么操作系统实际版本与购买时镜像版本不一致？ - 弹性云服务器 ECS

问题现象在云服务器执行以下命令查看系统当前版本： /etc/redhat-release 得到当前云服务器版本为CentOS 7.6。但在控制台使用的镜像为CentOS 7.2（或者低于7.6的其他版本）。本节操作适用于CentOS、EulerOS操作系统云服务器。根因分析

 帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
如何处理Nouveau驱动未禁用导致的问题 - 弹性云服务器 ECS

如何处理Nouveau驱动未禁用导致的问题问题描述 Nouveau驱动未禁用可能导致Linux系统卡死、虚拟机无法远程登录等问题。一般常见于客户使用自己的私有镜像（从ECS普通虚拟机导出的镜像或其他来源的私有镜像）。判断方式执行以下命令，查看Linux内核环缓冲区中的错误关键字信息。 dmesg

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
（推荐）通过管理控制台创建密钥对 - 弹性云服务器 ECS

若不慎遗失，您可以通过重置密钥对的方式，重新为弹性云服务器绑定密钥对。若已授权托管私钥，可根据需要将托管的私钥导出使用，详细内容请参见导出私钥。勾选“我已经阅读并同意《密钥对管理服务免责声明》” 单击“确定” 相关操作如果私钥文件丢失，您可以通过“重置密钥对”功能重新配置弹性云服务器的密钥对。

帮助中心 > 弹性云服务器 ECS > 用户指南 > 密码和密钥对管理 > 管理ECS密钥对
通过脚本批量更新ECS一键式重置密码插件（Windows） - 弹性云服务器 ECS

操作场景当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时，可参考本文档操作。前提条件准备好执行机，执行机需满足的条件请参见约束与限制。需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。执行机应该与待更新机器在同一VPC下。

帮助中心 > 弹性云服务器 ECS > 用户指南 > 密码和密钥对管理 > 管理ECS一键式重置密码插件
如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

stream，推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID，表明GPU硬件故障需要下线维修。 79 GPU has fallen off the bus。总线脱落，需要下线维修详情可以参考NVIDIA的Xid描述文档：https://docs.nvidia.com/

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

-r 根据不同的系统在服务器中执行以下命令，查看安装驱动时的内核版本。 CentOS：find /usr/lib/modules -name nvidia.ko Ubuntu：find /lib/modules -name nvidia.ko 如果当前内核版本与安装驱动时的内核版本不

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何将扩容系统盘的空白分区在线扩容到非末尾的root分区？ - 弹性云服务器 ECS

如何将扩容系统盘的空白分区在线扩容到非末尾的root分区？操作场景弹性云服务器创建成功后，如果发现系统盘分区的容量大小和实际创建的系统盘大小不一致，可以将空白分区扩容到根分区，扩容系统盘的空白空间。本节介绍了怎样将空白分区在线扩容到非末尾的root分区。操作步骤以CentOS

帮助中心 > 弹性云服务器 ECS > 常见问题 > 磁盘分区/挂载/扩容
如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡）问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令查看显卡信息。如果在volatile Uncorr. ECC下发现存在ecc

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因总线脱落。内核版本不一致。问题影响显卡驱动安装失败，显卡无法使用。处理方法执行以下命令，查看内核版本，检查内核版本是否一致。 rpm -qa | grep

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

件，安装过程出错问题问题描述用户使用不带驱动的公共镜像或私有镜像，自行安装NVIDIA驱动软件包、CUDA软件包，在安装过程中脚本执行报错。判断方式确认用户使用的镜像文件。确认用户的NVIDIA软件包来源。确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

可能是因为显卡过热，用户先停止业务，待显卡缓解过热后再执行nvidia-smi命令，查看ERR!是否消失。如果回显正常，建议用户调整下业务，限制显卡运行的最大功率。如果仍未恢复正常，根据故障信息收集收集故障信息后联系技术支持处理。父主题：显卡故障诊断及处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
通过脚本批量更新ECS一键式重置密码插件（Linux） - 弹性云服务器 ECS

host_list.txt 将需要自动安装驱动的云服务器的相关信息填写到host_list.txt文件中。文件填写格式与登录待切换弹性云服务器的方式需要匹配。使用密钥对方式鉴权的云服务器，填写方式如下：使用密钥对方式鉴权的云服务器，请将创建弹性云服务器时保存的私钥文件，上传至与host_list

帮助中心 > 弹性云服务器 ECS > 用户指南 > 密码和密钥对管理 > 管理ECS一键式重置密码插件
通过AOM批量更新ECS一键式重置密码插件 - 弹性云服务器 ECS

输入“脚本名称”，并将步骤1下载的脚本文件复制到“脚本内容”区域。对于Windows操作系统的弹性云服务器，需将“脚本内容”的格式切换为“Bat”。手动替换脚本中下载地址，下载对应操作系统架构的一键式重置密码插件包。仅未绑定弹性公网IP的弹性云服务器需要执行本步骤。若待更新的弹性云服务器均已绑定弹性公网IP，则跳过本步骤，无需操作。

帮助中心 > 弹性云服务器 ECS > 用户指南 > 密码和密钥对管理 > 管理ECS一键式重置密码插件
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？可以，但是不建议这种部署方式。建议将一个应用软件内的不同部件部署到同一个区域，这样不同部件之间的通信可以采用内网网络通信，既可以节省因采用公网网络通信带来的带宽费用，又可以保证不同部件之间的网络通信质量。父主题：区域与可用区

 帮助中心 > 弹性云服务器 ECS > 常见问题 > 区域与可用区
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题问题描述用户业务是做渲染（推理）的，但用户选择了带Tesla驱动（GRID驱动）的公共镜像，运行软件时出错。例：用户使用场景为做渲染，但选错公共镜像，运行软件时报错“A D3D11-compatible GPU (Feature

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

如果用户使用的是vGPU实例，确认实例安装的驱动与主机的驱动版本是否匹配。登录实例所在主机。执行nvidia-smi命令，查看驱动版本，并对照版本配套关系。版本配套关系：https://docs.nvidia.com/grid/index.html 处理方法重启GPU弹性云服务器。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

问题原因某种健全性检查没有通过，GPU驱动程序不会使用或信任其内容（某些内容未被使用）。问题影响可能影响ECC相关非易失数据的记录，从而导致本该隔离的GPU内存页面继续使用。处理方法用户停止业务并执行业务迁移。执行业务迁移后，根据故障信息收集收集故障信息后联系技术支持处理。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令，查看显卡信息。如果在volatile Uncorr. ECC下ecc error > 0，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。如果在volatile

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法

总条数： 1198

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么操作系统实际版本与购买时镜像版本不一致？ - 弹性云服务器 ECS

如何处理Nouveau驱动未禁用导致的问题 - 弹性云服务器 ECS

（推荐）通过管理控制台创建密钥对 - 弹性云服务器 ECS

通过脚本批量更新ECS一键式重置密码插件（Windows） - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

如何将扩容系统盘的空白分区在线扩容到非末尾的root分区？ - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

通过脚本批量更新ECS一键式重置密码插件（Linux） - 弹性云服务器 ECS

通过AOM批量更新ECS一键式重置密码插件 - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线