检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
T4 GPU设备显示异常 问题描述 使用NVIDIA Tesla T4 GPU的云服务器,例如Pi2或G6规格,执行nvidia-smi命令查看GPU使用情况时,显示如下: No devices were found 原因分析 NVIDIA Tesla T4 GPU是NVIDIA的新版本,默认使用并开启GSP
竞价计费型实例 什么是竞价计费型实例? 华为云将可用的计算资源,按照一定折扣进行售卖,其价格随市场供需关系实时变化,这种打折销售、价格实时变化的计费模式称为“竞价计费”。 采用竞价模式购买的弹性云服务器,称之为“竞价计费型实例”,简称“竞价实例”。 在该计费模式下,您可以以折扣价
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
非硬件故障自恢复处理方法 如何处理Nouveau驱动未禁用导致的问题 如何处理ECC ERROR:存在待隔离页问题 如何处理升级内核后,驱动不可用问题 如何处理GPU掉卡问题 如何处理显卡ERR!问题 如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 如何处理驱动兼容性问题
GPU设备显示异常 问题描述 执行nvidia-smi查看GPU使用情况,显示如下: 单卡机器显示 No devices were found 多卡机器上显示卡数目不全 执行lspci | grep -i nvidia,显示卡数目正常。 处理方法 查看实例是否使用NVIDIA Tesla
根据表1,查询对应的磁盘设备。 “51776”对应的磁盘设备为“xvde”,即磁盘1使用的磁盘设备为xvde。 表1 磁盘分区与磁盘设备的映射关系 磁盘分区对应的主从设备号 磁盘设备 51712 xvda 51728 xvdb 51744 xvdc 51760 xvdd 51776
如果用户已购买过License,但是未配置License,请参考GPU加速型实例安装GRID驱动配置License服务器与License文件。 父主题: 非硬件故障自恢复处理方法
云备份(Cloud Backup and Recovery,CBR)可以为云服务器、云硬盘提供简单易用的备份服务,当发生病毒入侵、人为误删除、软硬件故障等事件时,可将数据恢复到任意备份点。 云备份保障用户数据的安全性和正确性,确保业务安全。 视频帮助 什么是云备份?三分钟带你快速了解什么是云备份服务。
通过移动设备登录Windows ECS 操作场景 本节操作以“Windows Server 2012 R2 数据中心版 64位”操作系统为例,介绍如何通过Microsoft Remote Desktop客户端登录Windows实例。 前提条件 云服务器状态为“运行中”。 已获取W
查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4 GPU设备显示异常进行处理。 如果使用其他规格的GPU云服务器,执行下一步。 查看系统日志“/var/log/message”,是否存在驱动相关报错。
Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing, 非硬件故障,可能是自身软件错误。 详情可以参考NVIDIA
GPU加速型实例自动安装GPU驱动(Windows) 如果自动安装驱动脚本中无用户需要的目标软件版本,请联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
通过移动设备登录Linux ECS 操作场景 本节操作介绍如何在移动设备上连接Linux实例。 以Termius为例介绍如何在iOS设备上连接 Linux 实例,详细操作请参考IOS设备上登录Linux云服务器。 以JuiceSSH为例介绍如何在Android设备上连接 Linux
少卡,请根据故障信息收集收集故障信息后联系技术支持处理。 CCE集群场景,请根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
/boot/initramfs-$(uname -r).img $(uname -r) 执行以下命令,重启云服务器。 reboot 父主题: 非硬件故障自恢复处理方法
GPU加速型实例自动安装GPU驱动(Windows) 如果用户已安装驱动,但驱动不匹配使用场景,请卸载驱动后重新安装。请参考安装GPU驱动。 父主题: 非硬件故障自恢复处理方法
执行以下命令,查看GPU信息。 nvidia-smi 如果回显正常,则问题已修复。 如果回显仍报错,请参考GPU驱动不可用中的处理方法进行操作。 父主题: 非硬件故障自恢复处理方法
-q -d PAGE_RETIREMENT 如果Pending Page Blacklist 为No,说明当前已无待隔离页。 父主题: 非硬件故障自恢复处理方法
文件系统错误导致文件系统进入只读模式。 文件系统是以只读方式进行的挂载。 硬件故障,包括磁盘有坏道或者Raid卡故障等硬件问题。 操作须知 修复文件系统,可能会产生数据丢失,请先备份数据后进行操作。 如以下场景均不符合,请检查存储或者磁盘硬件是否存在故障。 场景一:文件系统以只读方式挂载导致删除或者修改类操作失败