检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何收集驱动安装信息 收集驱动安装信息的方法如下: 登录弹性云服务器。 执行以下命令,检查是否禁用了nouveau驱动。 lsmod | grep nouveau 如果是驱动安装失败类问题,收集/var/log/nvidia-installer.log 驱动安装日志,并转储日志信息。
使用一键诊断工具检测当前弹性云服务器的主机、安全组、内存、磁盘等状态,帮您进一步进行问题排查及定位。 远程登录诊断工具的操作,请参见如何进行弹性云服务器的一键诊断?。 如果远程登录诊断工具无法帮助您准确定位问题,请记录诊断报告中的异常项,然后单击管理控制台右上方的“工单”,填写工单信息,获取技术支持。
当需要升级CUDA驱动版本时,需要卸载对应的CUDA库后,再安装对应的CUDA版本。 执行以下命令,卸载CUDA库。 /usr/local/cuda/bin/cuda-uninstaller “cuda-uninstaller”一般在“/usr/local/cuda/bin”目录下。 不同CUDA版本的卸载命令可
NetworkManager.service is masked。 可能原因 服务单元被禁用,导致NetworkManager服务无法启动。 处理方法 执行以下命令,解除服务单元mask状态。 systemctl unmask NetworkManager 父主题: 操作系统类(Linux)
关闭Selinux SUSE操作系统无selinux配置文件,跳过该项配置。 操作步骤 执行以下命令,在vi编辑器中打开“/etc/selinux/config”。 vi /etc/selinux/config 按“i”进入编辑模式,修改SELINUX=disabled。 修改完
stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。 79 GPU has fallen off the bus。总线脱落,需要下线维修 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/
e.sh 脚本将自动检测当前在服务器上除系统盘之外的盘符并显示出来,如/dev/vdb,然后需要输入要执行的盘符,例如 /dev/vdb。 图1 自动检测磁盘 输入盘符并回车后,脚本将自动执行硬盘的创建分区与格式化。 图2 输入盘符 根据提示输入磁盘需要挂载的路径,比如/data-test。
如何查询NVIDIA的错误信息 查询NVDIA错误信息的方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在error信息,保存回显结果。 dmesg | grep -i nvidia 也可过滤关键字后保存结果,例如:NVRM、nouveau、nvidia、nv字样等。 父主题:
以上内容仅为示例,具体请以实际情况为准,参数说明如下: 第一列为UUID,此处填写1中查询到的磁盘分区的UUID。 第二列为磁盘分区的挂载目录,可以通过df -TH命令查询。 第三列为磁盘分区的文件系统格式, 可以通过df -TH命令查询。 第四列为磁盘分区的挂载选项,此处通常设置为defaults即可。 第五列为Linux
问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile Uncorr. ECC下ecc error > 0,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。 如果在volatile
根因分析 执行以下命令,查询有问题的mount unit。 systemctl list-units --type=mount |grep failed test1.mount loaded failed failed /test1 执行以下命令,查询该unit的状态。
04云服务器通过SSH连接后,执行以下命令,修改grub配置。 cat /etc/default/grub 如下图所示,注释GRUB_TIMEOUT_STYLE=hidden,修改GRUB_TIMEOUT=10。 删除/etc/default/grub.d/目录下以“50”开头的所有文件。 rm -rf
如何处理显卡ERR!问题 问题描述 执行nvidia-smi命令,仅Pwr:Usage/Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。
Tomcat是一个被广泛使用的Java Web应用服务器。本文介绍了在华为云弹性云服务器上部署Java Web环境的操作步骤。首先需要下载部署Java Web环境所需的安装包,并将安装包上传至云服务器,然后设置弹性云服务器安全组规则,再安装并配置相关软件,完成开发环境的配置。 本文使用的云服务器以华为云CentOS
远程连接Windows云服务器报错:两台计算机无法在分配的时间内连接 问题描述 本地主机远程桌面连接云服务器时报错提示:两台计算机无法在分配的时间内连接。 图1 两台计算机无法在分配的时间内连接 解决方法 在本地主机单击“开始”,运行中输入cmd,用管理员身份运行cmd。 然后输入命令 netsh winsock
即可正常使用。 方法二:基于新的内核版本,重新安装驱动。 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行•查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis nvidia
done! 执行以下命令,再根据提示输入数据库管理员root账号的密码进入数据库。 mysql -u root -p 执行以下命令,使用MySQL数据库。 use mysql; 执行以下命令,查看用户列表。 select host,user from user; 此命令及以下数据库语句均以分号结尾,请勿忽略。
如何更换我的密钥对? 问题描述 更换云服务器密钥对,删除旧的密钥对时,无法使用新的密钥对登录云服务器。 处理方法 登录Linux云服务器上制作密钥对,首先用密码或旧的密钥登录到待更换密钥对的云服务器,然后执行以下命令: [root@host ~]$ ssh-keygen <==
5版本操作系统的弹性云服务器。 执行以下命令,将SELinux 配置文件中的“SELINUX=disabled”修改为“SELINUX=enforcing”。 vim /etc/selinux/config 执行以下命令,使系统重启时自动为文件系统打上selinux的标记。 touch
如何收集NVIDIA日志 收集NVIDIA日志方法如下: 登录弹性云服务器。 在任意目录下执行以下命令。(如果是CCE场景,进入到/opt/cloud/cce/nvidia/bin目录后执行) sh nvidia-bug-report.sh 或 ./nvidia-bug-report