检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何查询云平台上服务器的出口公网IP地址? 操作场景 当服务器上云后,通常通过弹性公网IP访问Internet。 您可以登录控制台,在弹性云服务器列表中查看弹性云服务器绑定的弹性公网IP,详细内容,请参见查看弹性云服务器详细信息(列表视图)。 如果想要不经过控制台,直接在弹性云服
如何解决多网卡的Linux弹性云服务器变更规格后网卡漂移? 问题描述 绑定了多个网卡的Linux系统弹性云服务器,如果在变更规格后执行ifconfig(或ip addr)命令时出现网卡设备名称与网卡MAC地址对应不一致的情况,则表明云服务器变更规格后发生了网卡漂移。 如下图所示,变更规格前后,分别在云服务器中执行ip
如何使用自动化工具配置华为云镜像源(x86_64和鲲鹏)? 操作场景 更新弹性云服务器的系统或者软件时,可以连接Internet,通过外部镜像源提供相关服务。但是,如果弹性云服务器无法访问Internet,或者外部镜像源提供的服务不稳定时,可以使用华为云提供的一键配置脚本完成镜像源配置并进行更新。
如何处理Nouveau驱动未禁用导致的问题 问题描述 Nouveau驱动未禁用可能导致Linux系统卡死、虚拟机无法远程登录等问题。一般常见于客户使用自己的私有镜像(从ECS普通虚拟机导出的镜像或其他来源的私有镜像)。 判断方式 执行以下命令,查看Linux内核环缓冲区中的错误关键字信息。
也可以进行设置,该操作不会影响现有数据。 本文介绍如何在fstab文件中使用UUID来设置自动挂载磁盘分区。不建议采用在“/etc/fstab”直接指定设备名(比如/dev/vdb1)的方法,因为云中设备的顺序编码在关闭或者开启弹性云服务器过程中可能发生改变,例如/dev/vdb
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messa
CentOS 6系列弹性云服务器如何安装图形化界面? 操作场景 为了提供纯净的弹性云服务器系统给客户,CentOS 6系列弹性云服务器默认没有安装图形化界面,如果您需要图形化界面,请参见本节内容进行安装。 约束与限制 弹性云服务器安装图形化界面前,请确保云服务器内存不小于2GB,
7系列弹性云服务器如何安装图形化界面? 操作场景 本节操作介绍CentOS 7系列操作系统的云服务器安装图像化界面。 约束与限制 弹性云服务器安装图形化界面前,请确保云服务器内存不小于2GB,否则可能出现图形化界面安装失败,或安装后无法启动的问题。 鲲鹏架构的弹性云服务器请先参考如何使用自动
Debian系列弹性云服务器如何安装图形化界面? 操作场景 为了提供纯净的弹性云服务器系统给客户,Debian系列弹性云服务器默认没有安装图形化界面,如果您需要图形化界面,请参见本节内容进行安装。 约束与限制 本文档适用于Debian8/9/10操作系统云服务器。 弹性云服务器安
如何将扩容系统盘的空白分区在线扩容到非末尾的root分区? 操作场景 弹性云服务器创建成功后,如果发现系统盘分区的容量大小和实际创建的系统盘大小不一致,可以将空白分区扩容到根分区,扩容系统盘的空白空间。 本节介绍了怎样将空白分区在线扩容到非末尾的root分区。 操作步骤 以CentOS
policy, freezing. ”错误,具体报错信息如下图所示。 可能原因 出现该报错由于当前操作系统开启了SElinux。 该文档适用于CentOS系统,在该版本的系统上开启了SELinux,可能会触发该问题。 处理方法 Linux云服务器启动后,在出现内核选项时按字母键e进入内核编辑模式。
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
EIP资源在什么情况下会被冻结,如何解除被冻结的EIP资源? EIP资源在如下情况会被冻结: 欠费被冻结 包年包月EIP资源 保留期,指宽限期到期后客户的包年/包月资源仍未续订,将进入保留期。保留期即被冻结状态。被冻结的资源不可用,也不能修改、删除。超过保留期仍未续费,冻结资源将
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
检查云服务器的防火墙是否开启。 在控制台使用VNC方式登录Windows云服务器。 单击桌面左下角的Windows图标,选择“控制面板 > Windows防火墙”。 图2 Windows防火墙 单击“启用或关闭Windows防火墙”。 查看并设置防火墙的具体状态:开启或关闭。 图3 查看防火墙状态
如何解决SR-IOV场景下win7弹性云服务器安装82599网卡驱动报错? 问题描述 从Intel官网下载最新的20.4.1版本驱动包(下载地址:https://downloadcenter.intel.com/search?keyword=Intel++Ethernet+Con