检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本地盘换盘预处理(超高I/O型实例) 操作场景 当进行“本地盘换盘”事件的“授权换盘”操作时,需要先对本地盘进行换盘预处理。 本文介绍如何对超高I/O型(I系列)的ECS实例进行本地盘的换盘预处理操作。 本地盘换盘操作会丢失故障本地盘上的数据,如果无需保留本地盘上的数据,可通过本操作换盘预处理。
SSH密钥无法登录,报错Authentication refused: bad ownership or modes for directory /root 问题描述 SSH密钥无法登录,报错Authentication refused: bad ownership or modes
RDP连接已断开,出现内部错误,错误代码4 问题描述 Windows操作系统云服务器在登录时会遇到“出现了内部错误”提示,无法正常连接到服务器。这种情况一般都是远程服务太忙导致。 可能原因 Remote Desktop Services服务忙碌导致的登录异常。 远程桌面登录后断开
GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办? 问题描述 GPU实例启动异常,检查系统日志,发现NVIDIA驱动空指针访问。如图1所示。 图1 NVIDIA驱动空指针访问 可能原因 GPU驱动异常。 处理方法 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
如何处理显卡ERR!问题 问题描述 执行nvidia-smi命令,仅Pwr:Usage/Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。
同一子网的两块网卡均绑定弹性公网IP 问题描述 云服务器上两块相同子网的网卡,均绑定了弹性公网IP。其中,主网卡绑定的弹性公网IP可以正常访问,但是扩展网卡的弹性公网IP无法访问。 可能原因 CentOS操作系统的弹性云服务器默认开启了反向过滤技术(rpfilter),云服务器的
RDP连接已断开,出现内部错误,错误代码4 问题描述 Windows操作系统云服务器在登录时会遇到“出现了内部错误”提示,无法正常连接到服务器。这种情况一般都是远程服务太忙导致。 可能原因 Remote Desktop Services服务忙碌导致的登录异常。 远程桌面登录后断开
Windows 2012系统卸载某些软件后无法进入系统桌面怎么办? 问题描述 针对Windows 2012操作系统,由于安装应用系统会用到.net framework 3.5,而2012自带的.net framework 4.5版本需要卸载,但是卸载之后可能会遇到黑屏、无法进入系统桌面的问题,只能调出任务管理器。
Linux实例执行命令或启动服务时出现错误:Cannot allocate memory 问题描述 Linux操作系统的ECS实例内存充足,但是在执行命令或启动服务时,出现错误提示“Cannot allocate memory”。 命令及执行结果如下: root@localhost:~#
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing,
Linux镜像安装一键式重置密码插件启动失败怎么办? 操作场景 Linux镜像安装一键式重置密码插件启动失败,请参考本章节处理。 问题描述 用户通过执行命令sudo sh setup.sh安装一键式重置密码插件,有如下报错: begin install CloudResetPwdAgent
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 问题描述 Linux操作系统的ECS实例发生异常重启事件,错误提示如下: Kernel panic - not syncing: NMI: Not continuing 同时,内核日志打印如下信息:
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
获取ECS一键式重置密码插件 操作场景 若弹性云服务器“重置密码”失败,有可能是由于未安装一键式重置密码插件或插件失效,您可以参考本章节获取一键式重置密码插件并校验其完整性。 获取并校验一键式重置密码插件完整性(Linux) 以root用户登录弹性云服务器。 执行以下命令,下载一键式重置密码插件及sha256校验码。
同一个VPC内的ECS内网无法互通或者出现丢包等现象时,如何排查? 问题描述 同一个VPC内的两台弹性云服务器无法互通或者出现丢包等现象。 排查思路 以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。 如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
EIP资源在什么情况下会被冻结,如何解除被冻结的EIP资源? EIP资源在如下情况会被冻结: 欠费被冻结 包年包月EIP资源 保留期,指宽限期到期后客户的包年/包月资源仍未续订,将进入保留期。保留期即被冻结状态。被冻结的资源不可用,也不能修改、删除。超过保留期仍未续费,冻结资源将
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? 可以,但是不建议这种部署方式。 建议将一个应用软件内的不同部件部署到同一个区域,这样不同部件之间的通信可以采用内网网络通信,既可以节省因采用公网网络通信带来的带宽费用,又可以保证不同部件之间的网络通信质量。 父主题:
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。