检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办? 问题描述 GPU实例启动异常,检查系统日志,发现NVIDIA驱动空指针访问。如图1所示。 图1 NVIDIA驱动空指针访问 可能原因 GPU驱动异常。 处理方法 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
初始化Linux数据盘(容量大于2TiB) 操作场景 云硬盘容量大于2TiB时,只能使用parted工具为磁盘新建GPT分区。不同云服务器的操作系统的初始化操作可能不同。 分区格式 操作系统 文件系统 初始化工具 配置示例 GPT 不限 ext*(如ext2、ext3、ext4)、xfs、btrfs
卸载GPU加速型ECS的GPU驱动 操作场景 当GPU加速型云服务器需手动卸载GPU驱动时,可参考本文档进行操作。 GPU驱动卸载命令与GPU驱动的安装方式和操作系统类型相关,例如: Windows操作系统卸载驱动 Linux操作系统卸载驱动 Windows操作系统卸载驱动 以Windows
pip安装软件时出现错误:command ´gcc´ failed with exit status 1 问题描述 安装Python库软件时,需配置pip源。以中国科技大学镜像源为例: [root@test home]# cat /root/.pip/pip.conf [global]
Windows 2012系统卸载某些软件后无法进入系统桌面怎么办? 问题描述 针对Windows 2012操作系统,由于安装应用系统会用到.net framework 3.5,而2012自带的.net framework 4.5版本需要卸载,但是卸载之后可能会遇到黑屏、无法进入系统桌面的问题,只能调出任务管理器。
配置多用户登录后,普通用户登录闪屏怎么办? 问题描述 Windows服务器配置多用户登录后,Administrator登录正常,普通用户登录后出现闪屏,或者打开"我的电脑"出现自动关闭,不能正常使用。 处理方法 使Administrator用户登录服务器,查看系统日志及应用日志,
VNC方式登录后,播放音频文件没有声音 问题描述 使用MSTSC方式登录Windows云服务器,可以正常播放音频文件。但是,使用VNC方式登录Windows云服务器时,播放音频文件没有声音。 可能原因 VNC方式不具备音频调用能力。 处理方案 通过本地PC播放Windows弹性云服务器上的音频文件。以Windows
如何处理驱动兼容性问题 问题描述 用户执行nvidia-smi命令回显报错“No devices were found”。 No devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4
KVM实例变更至QingTian实例后出现蓝屏或业务异常,如何回滚至初始规格? 操作场景 当云服务器的操作系统为Windows 2016,且从KVM架构规格变更为QingTian规格架构时,系统可能会出现蓝屏或业务异常。 KVM实例:参考规格清单,查询对应规格的虚拟化类型。 Qi
Linux镜像安装一键式重置密码插件启动失败怎么办? 操作场景 Linux镜像安装一键式重置密码插件启动失败,请参考本章节处理。 问题描述 用户通过执行命令sudo sh setup.sh安装一键式重置密码插件,有如下报错: begin install CloudResetPwdAgent
Web访问超时系统日志打印:nf_conntrack:table full, dropping packet 问题现象 客户端访问web时出现time out。 服务端系统日志/var/log/messages打印kernel: nf_conntrack:table full, dropping
通过PuTTY Key Generator工具创建密钥对 操作场景 您可以通过puttygen.exe工具创建密钥对,创建完成后,公钥和私钥均保存在用户本地。 通过puttygen.exe工具创建成功的密钥对,还需要执行导入密钥对,导入系统才能正常使用密钥对。 操作步骤 在以下路
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 问题描述 Linux操作系统的ECS实例发生异常重启事件,错误提示如下: Kernel panic - not syncing: NMI: Not continuing 同时,内核日志打印如下信息:
(推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Windows实例上通过脚本自动安装GPU驱动。 使用须知 如果GPU加速型实例已安
为什么操作系统实际版本与购买时镜像版本不一致? 问题现象 在云服务器执行以下命令查看系统当前版本: /etc/redhat-release 得到当前云服务器版本为CentOS 7.6。但在控制台使用的镜像为CentOS 7.2(或者低于7.6的其他版本)。 本节操作适用于CentOS、EulerOS操作系统云服务器。
如何处理Nouveau驱动未禁用导致的问题 问题描述 Nouveau驱动未禁用可能导致Linux系统卡死、虚拟机无法远程登录等问题。一般常见于客户使用自己的私有镜像(从ECS普通虚拟机导出的镜像或其他来源的私有镜像)。 判断方式 执行以下命令,查看Linux内核环缓冲区中的错误关键字信息。
(推荐)自动安装GPU加速型ECS的GPU驱动(Linux) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Linux实例上通过脚本自动安装GPU驱动。 使用须知 本操作仅支持Linux操作系统。
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because