搜索_华为云

SSH密钥无法登录，报错Authentication refused: bad ownership or modes for directory /root - 弹性云服务器 ECS

SSH密钥无法登录，报错Authentication refused: bad ownership or modes for directory /root 问题描述 SSH密钥无法登录，报错Authentication refused: bad ownership or modes

帮助中心 > 弹性云服务器 ECS > 故障排除 > SSH连接
如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

处理方法推荐客户使用自动安装驱动脚本。根据当前华为云驱动自动安装脚本中提供的CUDA版本，按需安装。 GPU加速型实例自动安装GPU驱动（Linux） GPU加速型实例自动安装GPU驱动（Windows）如果自动安装驱动脚本中无用户需要的目标软件版本，请联系技术支持处理。父主题：

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU掉卡问题 - 弹性云服务器 ECS

执行以下命令，显卡的数量与实际规格对应的显卡数量一致，且显卡在位状态正常（rev a1），请继续按照处理方法处理；如果查找不到显卡或者显示状态为rev ff，请根据显卡故障诊断及处理方法进行故障诊断。规格对应显卡数量可以通过GPU加速型查询。 lspci | grep -i nvidia

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
查询API版本信息列表（废弃） - 弹性云服务器 ECS

如果不支持微版本，这将是空字符串。 updated string 一个有特定值的字符串。 API版本为2.0时，值为2011-01-21T11:33:21Z，API版本是2.1时，值为 2013-07-23T11:33:21Z。表3 links字段数据结构说明参数参数类型描述

 帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 查询API版本信息（OpenStack Nova API）
如何处理可恢复的Xid故障问题 - 弹性云服务器 ECS

com/deploy/xid-errors/index.html。处理方法尝试重新运行作业并观察Xid错误是否消失。若错误持续存在，尝试检查代码或分析日志，确认是否为程序引入的Xid故障。若确认不是程序引入，请联系技术支持处理。父主题：非硬件故障自恢复处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
查询浮动IP资源池列表（废弃） - 弹性云服务器 ECS

查询浮动IP资源池列表（废弃）功能介绍查询浮动IP资源池列表。当前API已废弃，请使用"查询网络"。接口约束接口参数为：router:external=True GET /networks?router:external=True 返回结果中的name字段 URI GET

帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 浮动IP管理（OpenStack Nova API）
如何处理ECC ERROR：存在待隔离页问题 - 弹性云服务器 ECS

Blacklist 为No，说明当前已无待隔离页。方法二：执行以下命令，重启服务器。 reboot 执行以下命令，查看是否存在待隔离页。 nvidia-smi -q -d PAGE_RETIREMENT 如果Pending Page Blacklist 为No，说明当前已无待隔离页。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

配套问题问题描述用户业务是做渲染（推理）的，但用户选择了带Tesla驱动（GRID驱动）的公共镜像，运行软件时出错。例：用户使用场景为做渲染，但选错公共镜像，运行软件时报错“A D3D11-compatible GPU (Feature Level 11.0,Shader Model

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

communicate with the NVIDIA diver。判断方式执行以下命令，查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令，查看安装驱动时的内核版本。 CentOS：find /usr/lib/modules -name nvidia.ko Ubuntu：find

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

配置License。如果用户已购买过License，但是未配置License，请参考GPU加速型实例安装GRID驱动配置License服务器与License文件。父主题：非硬件故障自恢复处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
EIP资源在什么情况下会被冻结，如何解除被冻结的EIP资源？ - 弹性云服务器 ECS

全违规行为，即被冻结状态，在控制台上显示为冻结（违规冻结）。被冻结的资源不可用，也不能修改、删除。若要解除冻结状态，请提交工单。您可以参考更换弹性公网IP为实例更换EIP。 EIP绑定的实例涉嫌违规被冻结 EIP资源绑定的服务器涉嫌违规行为，被国家监管部门冻结。如您通过自检确认

 帮助中心 > 弹性云服务器 ECS > 常见问题 > 弹性公网IP类
通过puttygen.exe工具创建的密钥对，导入管理控制台失败怎么办？ - 弹性云服务器 ECS

txt格式保存在本地，保存公钥文件。将公钥文件导入管理控制台。登录管理控制台。单击管理控制台左上角的，选择区域和项目。选择“计算 > 弹性云服务器”。在左侧导航树中，选择“密钥对”。在“密钥对”页面，单击“导入密钥对”。将“.txt”格式文本文档中的公钥内容粘贴至“Public

帮助中心 > 弹性云服务器 ECS > 常见问题 > 密码与密钥对
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因总线脱落。内核版本不一致。问题影响显卡驱动安装失败，显卡无法使用。处理方法执行以下命令，查看内核版本，检查内核版本是否一致。 rpm -qa | grep

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

显卡散热异常、风扇损坏。问题影响显卡温度过高，影响用户业务。处理方法执行nvidia-smi命令，查看风扇是否正常。如果风扇转速为0，说明风扇可能存在损坏，用户停止业务，执行业务迁移后，根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题。如果风扇显示ERR

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题问题描述用户在Windows设备管理器显示适配器中查询显卡属性，发现设备状态中存在错误“由于该设备有问题，Windows已将其停止”。判断方式确认用户发生问题时的操作，是否有出现显存OOM。如果

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？可以，但是不建议这种部署方式。建议将一个应用软件内的不同部件部署到同一个区域，这样不同部件之间的通信可以采用内网网络通信，既可以节省因采用公网网络通信带来的带宽费用，又可以保证不同部件之间的网络通信质量。父主题：

帮助中心 > 弹性云服务器 ECS > 常见问题 > 区域与可用区
如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错问题原因 XID 说明 32 Invalid or corrupted push buffer stream，推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID，表明GPU硬件故障需要下线维修。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡）问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令查看显卡信息。如果在volatile Uncorr. ECC下发现存在ecc

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因某种健全性检查没有通过，GPU驱动程序不会使用或信任其内容（某些内容未被使用）。问题影响可能影响ECC相关非易失数据的记录，从而导致本该隔离的GPU内存页面继续使用。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

ECC下ecc error = 0，可以执行nvidia-smi -q查看所有的卡。如果Pending Page Blacklist 为No，且double bit ecc error较多，继续诊断是否达到换卡条件：执行nvidia-smi –r命令，重置GPU。执行nvidia-smi

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法

总条数： 1200

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

SSH密钥无法登录，报错Authentication refused: bad ownership or modes for directory /root - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理GPU掉卡问题 - 弹性云服务器 ECS

查询API版本信息列表（废弃） - 弹性云服务器 ECS

如何处理可恢复的Xid故障问题 - 弹性云服务器 ECS

查询浮动IP资源池列表（废弃） - 弹性云服务器 ECS

如何处理ECC ERROR：存在待隔离页问题 - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

EIP资源在什么情况下会被冻结，如何解除被冻结的EIP资源？ - 弹性云服务器 ECS

通过puttygen.exe工具创建的密钥对，导入管理控制台失败怎么办？ - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

如何处理用户的虚拟机报错：“由于该设备有问题，Windows已将其停止”问题 - 弹性云服务器 ECS

一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域？ - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线