检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile Uncorr. ECC下ecc error > 0,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。
com/release/script/diagnose_gpu.sh 执行bash diagnose_gpu.sh命令,将信息收集到信息文件diagnose_gpu_xxxxx.tar.gz进行自排查或工单联系技术支持。 使用命令获取信息请参考表1。 表1 获取信息方法 信息分类 相关文档 显卡基本信息 如何获取显卡ID
failed报错,重新设置过期账号密码或调整账号过期时间即可。 处理方法 方法一: 以root用户登录Linux云服务器。 执行以下命令,重置过期账号的密码。 chage -l 过期账号 方法二: 执行以下命令,调整账号过期时间。 chage -E 过期时间 过期账号 父主题: Linux远程登录报错类
间内连接。 图1 两台计算机无法在分配的时间内连接 解决方法 在本地主机单击“开始”,运行中输入cmd,用管理员身份运行cmd。 然后输入命令 netsh winsock reset 根据提示重启本地主机后,重新连接云服务器。 父主题: Windows远程登录报错类
记录审计规则的文件。 操作步骤 安装auditd 执行以下命令安装auditd工具。 yum install -y auditd* 首次安装auditd 后,审计规则默认为空,可通过sudo auditctl -l命令查询。 执行以下命令查看运行状态。 service auditd status
以root用户登录云服务器。 执行以下命令,查询磁盘信息。 fdisk -l | grep 'Disk /dev/' 图1 查询磁盘信息 如图1所示,云服务器共有3块磁盘:/dev/vda、/dev/vdb、/dev/vdc。 执行以下命令,查看磁盘挂载情况。 df -h| grep
VNC方式登录弹性云服务器后,查看数据失败,VNC无法正常使用? 使用VNC方式登录弹性云服务器后,执行查看数据操作时,例如在Linux操作系统下使用cat命令查看大文件、播放视频,由于部分浏览器自身内存占用太大,导致VNC无法正常使用。 此时,请更换其他浏览器后重新登录弹性云服务器。 如问题未解决,请联系技术支持。
则由于SELinux开启时,重置密码插件不能在根目录下执行,需要关闭SELinux。 处理方法 执行以下命令,临时关闭SELinux。 setenforce 0 再次执行关闭Selinux操作,确保虚拟机重启后生效。 执行以下命令,重新安装重置密码插件。 sudo sh setup.sh 如果脚本执行成功打
100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc error,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。
SSH远程登录配置文件(/etc/ssh/sshd_config)中配置了密码重试策略,多次连续输入错误密码后,提示该错误。 处理方法 远程登录弹性云服务器。 执行以下命令,查看sshd_config文件中是否包含如下配置。 cat /etc/ssh/sshd_config 回显如下类似信息,表示连续6次输入密码错误后,会断开SSH连接。
如何修改Linux弹性云服务器的密码? 处理方法 根据已有的密钥文件,通过密钥方式以root用户登录Linux弹性云服务器。 执行以下命令,重置root的用户密码。 passwd 如果是重置其他用户的密码,请将“passwd”替换为“passwd username”。 根据系统显示的如下回显信息,输入新密码。
update更新软件列表。 执行命令yum makecache后,如果回显信息为“Another app is currently holding the yum lock”,则需执行命令rm -rf /var/run/yum.pid删除yum.pid文件,然后再执行命令yum makecache生成缓存。
重启云服务器,或执行以下命令重启sshd服务。 service sshd restart 或 systemctl restart sshd 在本地主机执行以下命令,远程连接到服务器。 sftp root@IP地址 连接成功后,您可以使用交互式的sftp命令。 执行以下命令,上传或下载文件、文件夹。
Xauthority”报错,具体报错信息如下图所示。 可能原因 通常是因为在创建用户时,用户家目录属组和属主不对导致。 处理方法 登录弹性云服务器。 执行以下命令,给用户家目录赋予用户的所有权限。 chown -R devops:devops /home/devops 重启云服务器。 reboot 父主题:
VNC方式登录弹性云服务器后,查看数据失败,VNC无法正常使用? 使用VNC方式登录弹性云服务器后,执行查看数据操作时,例如在Linux操作系统下使用cat命令查看大文件、播放视频,由于部分浏览器自身内存占用太大,导致VNC无法正常使用。 此时,请更换其他浏览器后重新登录弹性云服务器。 如问题未解决,请联系技术支持。
其他SSH工具连接云服务器正常,但是Winscp无法连接到服务器。说明SSH服务是没有问题的,Winscp连接基于的是SFTP协议。 执行以下命令,查看/etc/ssh/sshd_config文件。 vi /etc/ssh/sshd_config 查看关于SFTP的配置描述,说明SF
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
Linux操作系统云服务器中buffer和cache占用内存怎么办? 问题描述 系统长期运行后,free命令查看系统内存,发现剩余内存不足,大部分是buffers和cached。 问题分析 在 Linux 的内存管理中,buffer是Linux内存中的Buffer cache。cache是Linux内存中的Page
如果您使用其他Linux镜像,请通过华为云QingTian开源仓库进行编译安装。如果您使用Huawei Cloud EulerOS系统镜像时,通过以下命令直接安装: yum install qingtian-tool 该rpm包中包含两个工具: qt-enclave-env:提供资源隔离功能,QingTian