检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Windows实例上通过脚本自动安装GPU驱动。 使用须知 如果GPU加速型实例已安
控制台与弹性云服务器内部之间磁盘挂载点的对应关系 操作场景 登录弹性云服务器查询磁盘设备信息,发现磁盘的设备名称与控制台上显示的挂载点不一致,不清楚磁盘具体挂载在哪个设备上或磁盘对应的逻辑卷标识。本节操作介绍如何根据控制台上显示的磁盘信息,查询该磁盘在弹性云服务器内对应的设备名称。 磁盘挂载相关的操作,请参见挂载磁盘。
或 systemctl restart sshd (可选)配置防火墙。如防火墙关闭,可以忽略防火墙的配置操作。 CentOS 7的防火墙是firewalld,CentOS 6版本用的iptables,两者使用上有些差别,以下操作以CentOS 7为例。 执行如下命令查看防火墙状态:firewall-cmd
国-香港。 请确认已经配置了华为云提供的内网DNS服务器地址。 华为云内网DNS地址,请参见华为云提供的内网DNS地址是多少。 配置DNS地址请参考如何为ECS配置DNS?。 本节操作适用于x86_64架构和鲲鹏架构的云服务器。 当前支持的操作系统版本包括:EulerOS、CentOS、Debian、Ubuntu。
常用操作“开机/关机/重启/更多”的右侧即为“失败信息”。 图1 失败任务 单击“失败信息”栏对应的数字,即可查看系统处理失败的任务详情。其中: 创建失败:您可以从创建失败的列表中查看创建中和创建失败的任务。 操作失败:您可以从操作失败列表中查看处理异常的任务,包括异常任务的具体操作、错误码等,
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
无公网IP的弹性云服务器访问Internet SNAT 通过公网NAT网关的SNAT规则访问公网 无公网IP的弹性云服务器对互联网提供服务 DNAT 通过公网NAT网关的DNAT规则面向公网提供服务 通过Linux操作系统的代理主机 本方案需要: 已拥有一台绑定了公网IP的弹性云服务器作为代理弹性云服务器。
-r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find /lib/modules -name nvidia.ko 如果当前内核版本与安装驱动时的内核版本不
如何解决Ubuntu 16.04云服务器可以通过SSH成功登录,但VNC界面无法到达登录界面的问题 问题描述 用户Ubuntu16.04系统通过SSH连接成功,但是VNC方式登录时到不了login界面。 约束与限制 本操作涉及修改grub配置文件,误操作可能会导致系统无法启动。操
图形加速的场景。 使用公共镜像创建的图形加速型(G系列)实例默认已安装特定版本的GRID驱动,但GRID License需自行购买和配置使用。 使用私有镜像创建的GPU加速型实例,则需要安装GRID驱动并自行购买和配置使用GRID License。 如果通过私有镜像创建的GPU实
从marker指定的云服务器ID的下一条数据开始查询。 tags 否 String 查询tag字段中包含该值的云服务器。 not-tags 否 String 查询tag字段中不包含该值的云服务器,值为标签的Key。 说明: 系统近期对标签功能进行了升级。如果之前添加的Tag为“Key
远程桌面协议(Remote Desktop Protocol,RDP),是微软提供的多通道的远程登录协议。本节为您介绍如何使用RDP文件远程登录Windows弹性云服务器。 从管理控制台下载的RDP文件对应唯一的云服务器,当前RDP文件命名规则为“云服务器名称-弹性IP”。 前提条件 弹性云服务器状态为“运行中”。
CUDA工具包获取方式中的对应的索引项在页面中进行选择。 图14 选择CUDA的版本 选择完成后,页面会自动呈现出Ubuntu 20.04 64bit对应的CUDA 10.1的下载地址,复制下载地址。 在云服务器内部执行如下命令进行下载。 wget 复制的链接地址 例如:wget
GPU加速型ECS的GRID驱动。 如果需要实现计算加速能力,则需要安装Tesla驱动。 使用公共镜像创建的计算加速型(P系列)实例默认已安装特定版本的Tesla驱动。 使用私有镜像创建的GPU加速型实例,如需安装Tesla驱动请参考手动安装GPU加速型ECS的Tesla驱动。 表1
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
镜像的加密属性,不可更改。 使用未加密的云服务器创建的私有镜像为未加密的私有镜像。 使用加密的云服务器创建的私有镜像为加密的私有镜像。 名称 设置一个便于您识别的镜像名称。 企业项目 从下拉列表中选择所在的企业项目。该参数针对企业用户使用,只有开通了企业项目的客户,或者权限为企业主账号的客户才可见。如需
高频常见问题 远程登录 如何进行弹性云服务器的一键诊断? 无法登录到Windows云服务器怎么办? 无法登录到Linux云服务器怎么办? 远程登录时需要输入的账号和密码是多少? Windows云服务器如何配置多用户登录? 申请多用户会话授权的license并激活云服务器 云服务器故障/卡顿
回显信息中出现类似这样的一条信息:Log file is /root/.vnc/xxx:1.log。其中,“1”表示当前用户分配的是VNC的第一个虚拟桌面。 云服务器控制台配置 登录云服务器管理控制台。 单击弹性云服务器名称,进入详情页面。 选择“安全组”页签,单击待配置安全组规则右侧的“配置规则”。