检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
磁盘脱机怎么办? 问题描述 Windows操作系统的云服务器由于管理员设置的策略,该磁盘处于脱机状态,提示:由于管理员设置的策略,该磁盘处于脱机状态,如图1所示。 图1 磁盘脱机 问题原因 Windows操作系统SAN策略分为三种类型:OnlineAll,OfflineShared,OfflineInternal
authentication methods available 可能原因 SSH服务端配置了禁止密码验证登录的策略。 处理方法 编辑 /etc/ssh/sshd_config 文件,检查如下设置 vi /etc/ssh/sshd_config 修改如下配置项: 把PasswordAuthentication
authentication methods available 可能原因 SSH服务端配置了禁止密码验证登录的策略。 处理方法 编辑 /etc/ssh/sshd_config 文件,检查如下设置 vi /etc/ssh/sshd_config 修改如下配置项: 把PasswordAuthentication
用户执行nvidia-smi命令回显报错“No devices were found”。 No devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4 GPU设备显示异常进行处理。
com/deploy/xid-errors/index.html。 处理方法 尝试重新运行作业并观察Xid错误是否消失。 若错误持续存在,尝试检查代码或分析日志,确认是否为程序引入的Xid故障。 若确认不是程序引入,请联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
由于用户账号过期导致出现Authentication failed报错,重新设置过期账号密码或调整账号过期时间即可。 处理方法 方法一: 以root用户登录Linux云服务器。 执行以下命令,重置过期账号的密码。 chage -l 过期账号 方法二: 执行以下命令,调整账号过期时间。 chage -E
明Nouveau驱动已禁用。 如果回显信息中包含nouveau关键字样,说明Nouveau驱动已安装,则需要禁用Nouveau驱动。 处理方法 执行如下命令编辑blacklist.conf文件。 如果没有“/etc/modprobe.d/blacklist.conf”文件,请新建一个。
执行以下命令,查看GPU信息。 nvidia-smi 如果回显正常,则问题已修复。 如果回显仍报错,请参考GPU驱动不可用中的处理方法进行操作。 父主题: 非硬件故障自恢复处理方法
23/tcp (可选)设置防火墙开机自启动。 systemctl enable firewalld.service 查看防火墙设置开机自启是否成功。 systemctl is-enabled firewalld.service;echo $? 回显信息如下说明已设置成功: [root@ecs-centos7
PAGE_RETIREMENT 如果3的回显结果中Pending Page Blacklist为Yes,说明存在待隔离页,需要重新加载驱动去隔离。 处理方法 方法一: 执行以下命令,查看GPU使用情况并停掉所有占用GPU的进程。 nvidia-smi 执行以下命令,重置GPU。 nvidia-smi
本节内容适用于Windows 2008及以上版本操作系统的弹性云服务器。 右键单击“计算机”,选择“属性”。 在左侧导航栏,选择“高级系统设置”。 系统打开“系统属性”窗口。 选择“高级”页签,并单击“性能”栏的“设置”。 系统打开“性能选项”窗口。 图1 性能选项 选择“高级”页签,并单击“处理器计划”栏的“后台服务”。
启动JuiceSSH,单击“连接”。 图5 启动JuiceSSH 在“连接”页面单击图标。 图6 连接 在“新建连接”页面上,添加基本设置和高级设置的信息并保存。需要添加的信息如下: 昵称:指定登录会话的名称,如本例中,设置为“linux_test”。 类型:使用默认值“SSH”。 地
SSH服务端配置了禁止root用户登录的策略。 处理方法 账号或密码输入错误。 检查输入的用户名或密码。 Linux云服务器默认用户名root,如果密码错误,请在控制台重置密码。 重置密码:选中待重置密码的云服务器,并选择“操作”列下的“更多 > 重置密码”。 SSH服务端配置了禁止root用户登录的策略。
图4 public区域已开放端口 public区域下开放了80端口。 由此可知,防火墙规则与网卡接口不在同一区域,导致无法访问网站。 解决方法 方案一 在网卡接口指定区域增加防火墙规则,开放80端口,具体操作如下。 执行如下命令,开放80端口。 firewall-cmd --zone=external
能表现差;查看/var/log/messages日志发现有如下报错,询问用户后确认用户购买了License但是未配置License。 处理方法 确认用户业务使用场景是否是做图形处理,用户使用的实例规格是否满足图形处理要求。 用户是否安装GRID驱动,执行nvidia-smi命令查询回显是否正常。
远程计算机的身份 问题描述 由于在安全软件中设置了安全登录限制,导致远程桌面连接Windows云服务器报错:无法验证此远程计算机的身份。需要再次登录输入密码。 图1 协议错误 可能原因 云服务器安装了安全软件,防止有未知IP登录云服务器。 解决方法 卸载安全软件。 登录安全软件,将登录安全等级修改为系统默认登录方式。
节内容重新设置密码。 本节操作重置的是root用户的密码,您可以重置完root密码后登录云服务器后再更换密钥或重置非root用户的密码。 Windows操作系统请参见重置Windows云服务器密码(未安装重置密码插件)。 如果弹性云服务器提前安装了密码重置插件,请参见在控制台重置云服务器密码操作获取新密码。
台临时弹性云服务器。 重新购买的弹性云服务器在重置密码后,建议释放,以免继续收费。 临时弹性云服务器已经绑定弹性公网IP,并配置系统apt-get源。 通过下面的方法,在临时弹性云服务器中安装ntfs-3g和chntpw软件包。 方法一: 执行以下命令,安装ntfs-3g和chntpw软件包。
kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep gcc #查看gcc版本 rpm -qa | grep