检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何获取显卡ID Linux操作系统获取显卡ID的方法如下: 登录弹性云服务器。 在任意路径下执行nvidia-smi命令。(CCE集群场景为/opt/cloud/cce/nvidia/bin目录下) Windows操作系统获取显卡ID的方法如下: 进入到C:\Program Files\NVIDIA
如何更换我的密钥对? 问题描述 更换云服务器密钥对,删除旧的密钥对时,无法使用新的密钥对登录云服务器。 处理方法 登录Linux云服务器上制作密钥对,首先用密码或旧的密钥登录到待更换密钥对的云服务器,然后执行以下命令: [root@host ~]$ ssh-keygen <==
如何查询内核信息 查询内核信息的方法如下: 登录弹性云服务器。 执行以下命令,查看内核版本。 uname -r 执行以下命令,查看安装驱动时的内核版本。 Ubuntu:find /lib/modules -name nvidia.ko CentOS:find /usr/lib/modules
如何将扩容系统盘的空白分区在线扩容到末尾的root分区? 操作场景 弹性云服务器创建成功后,如果发现系统盘分区的容量大小和实际创建的系统盘大小不一致,可以将空白分区扩容到根分区,扩容系统盘的空白空间。 本节介绍了怎样将空白分区在线扩容到末尾的root分区。 操作步骤 以CentOS
如何收集NVIDIA日志 收集NVIDIA日志方法如下: 登录弹性云服务器。 在任意目录下执行以下命令。(如果是CCE场景,进入到/opt/cloud/cce/nvidia/bin目录后执行) sh nvidia-bug-report.sh 或 ./nvidia-bug-report
Explorer中调试该接口。 URI GET /v2/{domain_id}/auto-launch-groups/{auto_launch_group_id}/instances 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 domain_id 是 租户域ID。 auto_launch_group_id
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
如何为ECS配置DNS? DNS服务器用于解析弹性文件服务中文件系统的域名。DNS服务器东北区IP地址为100.125.6.250,其它区域详情请参见华为云内网DNS地址。 操作场景 默认情况下,用于解析文件系统域名的DNS服务器的IP地址会在创建ECS时自动配置到ECS上,不需
如何收集驱动安装信息 收集驱动安装信息的方法如下: 登录弹性云服务器。 执行以下命令,检查是否禁用了nouveau驱动。 lsmod | grep nouveau 如果是驱动安装失败类问题,收集/var/log/nvidia-installer.log 驱动安装日志,并转储日志信息。
如何修改弹性云服务器的SID? 微软操作系统使用安全标识符(SID)对计算机和用户进行识别。如果需要搭建Windows域环境,由于基于同一镜像创建的云服务器SID相同,会引起无法入域,此时需要通过修改SID以达到入域的目的。 本节操作介绍使用sidchg工具修改云服务器SID的方法。
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
如何配置端口映射? 问题描述 公网访问“弹性云服务器1”的弹性公网IP和某个端口,可以自动跳转到“弹性云服务器2”的弹性公网IP和某个端口。 Windows操作系统 假定需要通过“弹性云服务器1”(192.168.10.43)的8080端口连接“弹性云服务器2”(192.168.10
如何备份本地盘数据? 操作场景 对于包含本地盘的弹性云服务器,当进行实例重部署、本地盘换盘等事件的响应操作时,可能导致本地盘的数据被清空。为了保障数据安全,建议您在授权事件操作前进行本地盘数据备份。 弹性云服务器不支持直接备份本地盘数据,需要通过挂载云硬盘实现本地盘数据的迁移。 操作步骤
如何处理驱动兼容性问题 问题描述 用户执行nvidia-smi命令回显报错“No devices were found”。 No devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
如何使用auditd记录Linux系统文件改动 auditd是Linux审计系统的用户空间组件,可以记录操作系统中的操作日志,包括文件读写、系统调用的记录等,出现问题可以用于审计。本文以CentOS 7.4 64位操作系统为例介绍auditd工具的安装和配置。 auditd相关工具命令与配置文件
用户误删除Tools后,如何获取数据盘信息? Linux操作系统下,用户由于误操作卸载弹性云服务器上的Tools,会对非PVOPS系统的磁盘和网卡产生影响,导致系统无法发现数据盘。此时,用户可通过新建一个弹性云服务器,将原数据盘挂载至新创建的弹性云服务器下,从而获取丢失的数据盘信息。具体操作方法如下:
CentOS 6.5系统如何添加静态路由? 操作场景 为系统添加静态路由,避免重启系统后路由丢失而影响到网络可用性。 操作步骤 以CentOS 6.5操作系统为例。 登录弹性云服务器。 创建或修改静态路由配置文件。 在“/etc/sysconfig/”目录下创建或修改静态路由配置
如何查询显卡详细信息 查询指定显卡的详细信息 登录弹性云服务器。 执行以下命令,查询指定显卡的详细信息。 nvidia-smi –q –i ${显卡ID} 查询所有显卡的详细信息 登录弹性云服务器。 执行以下命令,所有显卡的详细信息。 nvidia-smi -q 执行结果示例如下: