检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
log日志,如果有说明GPU驱动已被卸载,请重新安装GPU驱动。 如果已安装驱动,但是驱动状态异常。 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis
在弹性云服务器的“操作”列下,单击“更多 > 磁盘/备份 > 新增磁盘”。 系统跳转至购买磁盘页面。 根据界面提示,设置新添加云硬盘的参数信息。 云硬盘的参数信息配置请参考购买云硬盘。 新增磁盘默认与弹性云服务器计费模式保持一致。 新增磁盘默认与弹性云服务器位于同一区域。 新增磁盘默认
方法一: 执行以下命令,打开“/etc/sysctl.conf”文件。 vim /etc/sysctl.conf 按i进入编辑模式。 修改net.ipv4.ip_forward = 0。 按ESC退出,并输入:wq!保存配置。 方法二: 执行sed命令,命令示例如下: sed -i
7版本后,可能会引起Cloud-init不工作,具体表现为:弹性云服务器的密码、密钥、hostname等信息无法通过Cloud-init注入。 执行命令cloud-init -v查询Cloud-init的版本,回显报错,如图1所示。 图1 Cloud-init运行异常 可能原因 Cloud
动的问题。 操作步骤 登录云服务器后,执行以下命令,更新软件库。 apt update 执行以下命令,升级软件库。 apt upgrade 执行以下命令,安装tasksel软件。 apt install tasksel 执行以下命令,使用tasksel安装gnome图形化界面。 tasksel
Windows弹性云服务器之间互换系统盘 弹性云服务器的登录鉴权方式不同,登录方法存在差异。假设有3台Windows弹性云服务器,参数配置如表1所示。 表1 Windows弹性云服务器参数配置 弹性云服务器 系统盘 登录鉴权方式 密码/密钥对 ecs_01 vol_01 密码/密钥对 如果为密码方式,假设密码为:Ecs@01
云服务器是否有图形界面? Windows操作系统是桌面管理,Linux操作系统是命令行,用户如果需要可以自己设置图形管理。 弹性云服务器安装图形化界面前,请确保云服务器内存不小于2GB,否则可能出现图形化界面安装失败,或安装后无法启动的问题。 鲲鹏架构的弹性云服务器请先参考镜像源管理使用华为云提供的镜像源进行更新。
04操作系统的云服务器,并使用DHCP获取IP。 处理方法 执行以下命令,确认dhclient是否运行。 ps -ef |grep dhclient |grep -v grep 如果未找到dhclient进程,则确认dhclient进程未运行,执行以下命令,继续排查NetworkManager是否运行。
conf' 执行以下命令,升级操作系统内核版本。 sudo yum update -y 执行以下命令,更新GRUB配置文件,以便ECS在启动时选择新的内核版本。 sudo grub2-mkconfig -o /boot/grub2/grub.cfg 执行以下命令,重启ECS。 sudo
在本地主机单击“开始”菜单,输入mstsc命令,打开远程桌面对话框。 通过本地Windows主机登录Windows ECS。 Linux 安装远程连接工具,例如rdesktop,执行连接命令。 通过本地Linux主机登录Windows ECS。 macOS系统 安装远程连接工具,例如Microsoft
CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。 非硬件故障自恢复处理方法:这类问题可以根据指导自行排查恢复。
首次登录,默认会打开CloudShell配置向导,输入云服务器的相关参数进行连接。 您可以选择使用云服务器的弹性公网IP或私有IP进行登录。 若勾选云服务器的公网IP(弹性公网IP)。 在CloudShell配置向导中设置云服务器的端口(默认22)、用户名、认证方式、密码(或密钥)等参数。 单击“连接”登录云服务器。
update更新软件列表。 执行命令yum makecache后,如果回显信息为“Another app is currently holding the yum lock”,则需执行命令rm -rf /var/run/yum.pid删除yum.pid文件,然后再执行命令yum makecache生成缓存。
Linux系统、SCSI类型磁盘的云服务器进行在线并发(大于10个)扩容,扩容之后部分磁盘容量实际未发生变化。 例如,将磁盘容量由1G在线并发扩容到2G后,执行lsblk命令查看磁盘容量,发现sdb/sdc/sdd/sdr的磁盘容量没有发生变化。 图1 报错信息 问题分析 当SCSI磁盘IO压力大时,磁盘队列无
如果用户使用的是私有镜像或其他镜像,可通过nvidia-smi命令查询是否安装了驱动以及确认驱动类型、驱动版本。 如客户选择自行安装Tesla驱动,请务必告知客户确保Tesla驱动与CUDA软件的版本配套关系,可参考Tesla驱动及CUDA工具包获取方式。 处理方法 如果用户未安装驱动,请自行
获取故障盘挂载点 远程登录待换盘预处理的弹性云服务器。 执行以下命令,查看故障本地盘的WWN号对应的盘符信息。 ll /dev/disk/by-id/ | grep WWN号 以WWN号“wwn-0x5000c500e01a4930”为例,命令如下: ll /dev/disk/by-id/ |
couldn't communicate with the NVIDIA diver。 判断方式 执行以下命令,查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia
inet dhcp 执行如下命令,保存并退出interfaces文件。 :wq 执行命令ifup ethX或/etc/init.d/networking restart,使新增网卡生效。 上述命令中的X为具体的网卡名称序号,例如,ifup eth2。 执行如下命令,查看回显信息中是否包括2查询到的网卡。
currently holding the yum lock”,则需执行命令rm -rf /var/run/yum.pid删除yum.pid文件,然后再执行命令yum makecache生成缓存。 执行命令yum makecache后,如果回显报错“Error: Cannot retrieve
SSH密码方式 打开系统自带的终端(Terminal),执行以下命令,登录云服务器。 ssh 用户名@弹性公网IP 如果是公共镜像(包括CoreOS),用户名为“root”。 SSH密钥方式 打开系统自带的终端(Terminal),执行以下命令,变更权限。下面步骤以私钥文件是kp-123.pem为例进行介绍。