检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何获取显卡ID Linux操作系统获取显卡ID的方法如下: 登录弹性云服务器。 在任意路径下执行nvidia-smi命令。(CCE集群场景为/opt/cloud/cce/nvidia/bin目录下) Windows操作系统获取显卡ID的方法如下: 进入到C:\Program Files\NVIDIA
如何查询显卡详细信息 查询指定显卡的详细信息 登录弹性云服务器。 执行以下命令,查询指定显卡的详细信息。 nvidia-smi –q –i ${显卡ID} 查询所有显卡的详细信息 登录弹性云服务器。 执行以下命令,所有显卡的详细信息。 nvidia-smi -q 执行结果示例如下:
如何收集驱动安装信息 收集驱动安装信息的方法如下: 登录弹性云服务器。 执行以下命令,检查是否禁用了nouveau驱动。 lsmod | grep nouveau 如果是驱动安装失败类问题,收集/var/log/nvidia-installer.log 驱动安装日志,并转储日志信息。
怎样测试解析域名是否生效? 检查云服务器 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 选择“计算 > 弹性云服务器”。 在弹性云服务器列表中的右上角,输入弹性云服务器名称、IP地址或ID,并进行搜索。 单击弹性云服务器的名称,查看详情。 在弹性云服务器详情页面,选择“监控”页签,查看监控数据。
Windows Server 2016 ISO实例UEFI无法启动 问题描述 通过UEFI方式启动Windows Server 2016 ISO镜像失败,提示“UEFI Interactive Shell”。 处理方法 确认镜像是否支持UEFI启动。 若镜像中存在如下图所示的bootx64
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
以挂载点“/data”为例,命令如下: umount /data 检查报障云服务器的/etc/fstab中是否配置了故障盘对应的自动挂载信息 如果报障云服务器的/etc/fstab中配置了故障盘对应的自动挂载信息,则需要删除或注释掉,防止本地盘换盘后启动云服务器进入Emergency Mode(紧急模式)。
我能否自己安装或者升级操作系统? 弹性云服务器需要使用云平台提供的操作系统,登录到云服务器可对操作系统进行系统更新或补丁升级。 购买弹性云服务器时,通过选择的镜像来安装云服务器的操作系统。您可以选择公共镜像,或公共镜像制作成的私有镜像来安装云服务器的操作系统。根据实际的应用场景编程语言选择不同操作系
GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办? 问题描述 GPU实例启动异常,检查系统日志,发现NVIDIA驱动空指针访问。如图1所示。 图1 NVIDIA驱动空指针访问 可能原因 GPU驱动异常。 处理方法 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。
在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Linux实例上通过脚本自动安装GPU驱动。 使用须知 本操作仅支持Linux操作系统。 本操作当前仅支持安装Tesla驱动。 如果GPU加速型实例已安装GPU驱动
vGPU驱动。 GPU直通型实例:根据需求选择GRID驱动版本。 GPU虚拟化型实例:请严格按照下表选择合适的驱动版本下载使用。 表1 GPU实例类型支持的GRID驱动版本 实例类型 GPU挂载方式 操作系统 驱动版本 CPU架构 G6v GPU虚拟化型实例 CentOS 8.2 64bit
在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Windows实例上通过脚本自动安装GPU驱动。 使用须知 如果GPU加速型实例已安装GPU驱动,需要先卸载原驱动后再安装新的目标驱动。 当前仅部分GPU加速型实例的规格、
devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4 GPU设备显示异常进行处理。 如果使用其他规格的GPU云服务器,执行下一步。 查看系统日志“/var/lo
如何查询NVIDIA的错误信息 查询NVDIA错误信息的方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在error信息,保存回显结果。 dmesg | grep -i nvidia 也可过滤关键字后保存结果,例如:NVRM、nouveau、nvidia、nv字样等。 父主题:
Linux实例执行命令或启动服务时出现错误:Cannot allocate memory 问题描述 Linux操作系统的ECS实例内存充足,但是在执行命令或启动服务时,出现错误提示“Cannot allocate memory”。 命令及执行结果如下: root@localhost:~#
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
则表示时间同步配置成功。 后续处理 弹性云服务器重启后,DNS配置会被重置为VPC子网的DNS服务器地址。因此,建议在重启弹性云服务器前,查询该弹性云服务器的VPC子网DNS配置是否与目标DNS配置一致,如果不一致,请先修改弹性云服务器VPC子网的DNS服务器地址,具体操作请参见修改子网网络信息。
解决方案 远程登录ECS实例。 执行以下命令,查看ECS实例内核参数kernel.unknown_nmi_panic的值。 sysctl -n kernel.unknown_nmi_panic 如果内核参数的取值为1,说明是由于内核参数配置错误引起的ECS实例异常重启。 图1 排查结果
Boolean 弹性云服务器释放时,磁盘随实例释放策略。 true:磁盘随实例释放。 false:磁盘不随实例释放。 说明: 不支持修改包年/包月计费模式的磁盘。 不支持修改共享盘。 不支持修改系统盘。 响应消息 无 请求示例 修改云服务器挂载的磁盘属性为“磁盘随实例释放”。 PUT
ndows)。 GPU虚拟化型实例,需要严格按照表1选择合适的驱动版本下载使用。 Tesla驱动下载地址 请单击NVIDIA驱动下载,根据实例的类型,选择NVIDIA产品类型、产品系列和产品。 表1 Tesla驱动产品类型对应关系 实例类型 产品类型(Product Type) 产品系列(Product