检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何将扩容系统盘的空白分区在线扩容到末尾的root分区? 操作场景 弹性云服务器创建成功后,如果发现系统盘分区的容量大小和实际创建的系统盘大小不一致,可以将空白分区扩容到根分区,扩容系统盘的空白空间。 本节介绍了怎样将空白分区在线扩容到末尾的root分区。 操作步骤 以CentOS
通过元数据获取ECS基本信息 操作场景 弹性云服务器元数据包含了弹性云服务器在云平台的基本信息,例如云服务ID、主机名、网络信息等。弹性云服务器元数据支持两种风格,可以分别通过兼容Openstack和兼容EC2的API获取,如表1所示。对于支持的元数据类型,本节详细介绍了其URI和使用方法。
同一个VPC内的ECS内网无法互通或者出现丢包等现象时,如何排查? 问题描述 同一个VPC内的两台弹性云服务器无法互通或者出现丢包等现象。 排查思路 以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。 如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
获取ECS一键式重置密码插件 操作场景 若弹性云服务器“重置密码”失败,有可能是由于未安装一键式重置密码插件或插件失效,您可以参考本章节获取一键式重置密码插件并校验其完整性。 获取并校验一键式重置密码插件完整性(Linux) 以root用户登录弹性云服务器。 执行以下命令,下载一键式重置密码插件及sha256校验码。
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error 问题现象 root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messa
一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办? 问题描述 在弹性云服务器运行时,一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高。 图1 查看虚拟内存占用情况 问题根因 应用程序使用内存的时候通过glibc的内存池来提供,glibc 2.10之前的版本中,只有一个内存池,称为main
通过puttygen.exe工具创建的密钥对,导入管理控制台失败怎么办? 问题描述 通过puttygen.exe工具创建的密钥对,在导入管理控制台使用时,系统提示导入公钥文件失败。 可能原因 公钥内容的格式不符合系统要求。 当用户使用puttygen.exe工具创建密钥对时,如果使用puttygen
通过脚本批量更新ECS一键式重置密码插件(Linux) 操作场景 当您需要对多台Linux系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、root用户的密码信息或者私钥文件。
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
EIP资源在什么情况下会被冻结,如何解除被冻结的EIP资源? EIP资源在如下情况会被冻结: 欠费被冻结 包年包月EIP资源 保留期,指宽限期到期后客户的包年/包月资源仍未续订,将进入保留期。保留期即被冻结状态。被冻结的资源不可用,也不能修改、删除。超过保留期仍未续费,冻结资源将
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? 可以,但是不建议这种部署方式。 建议将一个应用软件内的不同部件部署到同一个区域,这样不同部件之间的通信可以采用内网网络通信,既可以节省因采用公网网络通信带来的带宽费用,又可以保证不同部件之间的网络通信质量。 父主题:
通过脚本批量更新ECS一键式重置密码插件(Windows) 操作场景 当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
安装单台ECS的一键式重置密码插件(单台操作) 弹性云服务器提供一键式重置密码功能。当弹性云服务器的密码丢失或过期时,如果提前安装了一键式重置密码插件,则可以应用一键式重置密码功能,给弹性云服务器设置新密码。 该方法方便、有效,建议您成功创建、登录弹性云服务器后,安装密码重置插件,具体操作请参见本节内容。
更新单台ECS的一键式重置密码插件(单台操作) 弹性云服务器提供一键式重置密码功能。当弹性云服务器的密码丢失或过期时,如果提前安装了一键式重置密码插件,则可以应用一键式重置密码功能,给弹性云服务器设置新密码。 更新一键式重置密码插件的操作请参考本节内容。 安装须知 弹性云服务器需
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果