检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Xauthority”报错,具体报错信息如下图所示。 可能原因 通常是因为在创建用户时,用户家目录属组和属主不对导致。 处理方法 登录弹性云服务器。 执行以下命令,给用户家目录赋予用户的所有权限。 chown -R devops:devops /home/devops 重启云服务器。 reboot 父主题:
VNC方式登录弹性云服务器后,查看数据失败,VNC无法正常使用? 使用VNC方式登录弹性云服务器后,执行查看数据操作时,例如在Linux操作系统下使用cat命令查看大文件、播放视频,由于部分浏览器自身内存占用太大,导致VNC无法正常使用。 此时,请更换其他浏览器后重新登录弹性云服务器。 如问题未解决,请联系技术支持。
如何修复虚拟化驱动异常的Windows弹性云服务器? 弹性云服务器配置的邮件无法正常发送 Windows弹性云服务器没有声音? 如何修改弹性云服务器的SID? 为什么按需计费的弹性云服务器开机失败? 为什么我的C6云服务器出现了性能下降现象? 使用free命令查看弹性云服务器的内存,为什么与实际不符?
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
max_user_watches值耗尽 磁盘分区block空间使用率达到100% 执行以下命令查看磁盘空间。 df -h 如回显信息如下所示说明block空间使用率100%。 解决方案:扩容云硬盘。 磁盘分区inode空间使用率达到100% 执行以下命令查看磁盘空间。 df -i 如回显信息如下所示说明inode空间使用率100%。
methods available 可能原因 SSH服务端配置了禁止密码验证登录的策略。 处理方法 编辑 /etc/ssh/sshd_config 文件,检查如下设置 vi /etc/ssh/sshd_config 修改如下配置项: 把PasswordAuthentication no
methods available 可能原因 SSH服务端配置了禁止密码验证登录的策略。 处理方法 编辑 /etc/ssh/sshd_config 文件,检查如下设置 vi /etc/ssh/sshd_config 修改如下配置项: 把PasswordAuthentication no
链路拥塞、链路节点故障、服务器负载高等问题均可能引起执行Ping命令时出现丢包或时延过高的问题。 具体检查操作请参考“Ping不通”。 检查云服务器路由配置(多网卡场景) 一般操作系统的默认路由优先使用主网卡,如果出现使用扩展网卡导致网络不通现象通常是路由配置问题。 如果云服务器配置了多网卡,请确认云服务器内默认路由是否存在。
Firmware,导致GPU无法识别。 处理方法一 该处理方法在重启云服务器后失效。 执行以下命令,移除NVIDIA内核模块。 rmmod nvidia_drm rmmod nvidia_modeset rmmod nvidia 执行以下命令,关闭GSP Firmware开关,并载入NVIDIA内核模块。 modprobe
通过VNC方式登录Linux实例。 执行如下命令,临时关闭SELinux。 setenforce 0 临时修改SELinux服务状态,实时生效,无需重启系统或实例。 永久关闭SELinux服务 通过VNC方式登录Linux实例。 执行如下命令,永久关闭SELinux服务。 sed -i
其中:99999为密码有效期限,user_name为系统用户,例如root用户。 建议用户根据实际情况及业务需求进行配置,定期使用该命令更新密码有效期。 再次执行vi /etc/login.defs,验证配置是否生效。 图1 验证配置 父主题: 密码与密钥对
conf 执行以下命令,使配置生效。 sysctl -p 调优limits参数 以启动报错业务进程的用户登录云服务器,执行以下命令查询当前配置参数。 ulimit -u 执行以下命令,根据业务需求和当前值评估,配置合适的nproc上限。 以root用户nproc配置100000为例:
网络配置 CentOS 7重启后dhclient未运行,导致无法获取IP Linux私有镜像网卡漂移问题处理 Linux系统重启后/etc/hosts自动添加主机名解析 多网卡配置文件导致network启动失败处理 Linux系统ping域名失败,提示Name or service
PU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。 dmesg | grep -i xid 若检查项GPU节点上的XID异常为空,说明无XID消息。
以root用户登录云服务器。 执行以下命令,查询磁盘信息。 fdisk -l | grep 'Disk /dev/' 图1 查询磁盘信息 如图1所示,云服务器共有3块磁盘:/dev/vda、/dev/vdb、/dev/vdc。 执行以下命令,查看磁盘挂载情况。 df -h| grep
SSH服务端配置了禁止root用户登录的策略。 处理方法 账号或密码输入错误。 检查输入的用户名或密码。 Linux云服务器默认用户名root,如果密码错误,请在控制台重置密码。 重置密码:选中待重置密码的云服务器,并选择“操作”列下的“更多 > 重置密码”。 SSH服务端配置了禁止root用户登录的策略。
conf,添加或者修改下列两行。 net.ipv4.tcp_tw_recycle = 0 net.ipv4.tcp_tw_reuse = 0 执行以下命令,使修改的配置生效。 sysctl -p 启动中修改内核参数可能存在内核加载该参数不稳定的情况,建议在合适的时间进行重启。 父主题: SSH连接
体操作请参见备案流程。 配置域名解析。 配置域名解析后才能使用注册的域名访问网站。具体操作请参见配置域名解析。 例如,配置的域名为“www.example.com”,配置成功后,可在浏览器地址栏中输入“http://www.example.com”访问部署的网站。 父主题: 搭建网站
GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。