检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作系统类型相同的弹性云服务器互换系统盘后,如何登录? 问题描述 按需购买的两台同类型弹性云服务器(操作系统类型相同,如Windows和Windows,Linux和Linux),关机卸载系统盘后,重新挂载至对方弹性云服务器,实现系统盘互换。互换成功后,弹性云服务器的登录密码或密钥可能会发生改变。此时,如何登录更换过系统盘的弹性云服务器?
以将其添加至开机启动项。具体方法请参见一键式密码重置插件启动失败时如何操作?。 一键式重置密码插件更新成功后,请勿删除重置密码进程CloudResetPwdAgent,否则,会导致一键式重装密码功能不可用。 华为云对一键式重置密码插件进行了升级,对于新创建的弹性云服务器,默认采用
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
如何解决Ubuntu 16.04云服务器可以通过SSH成功登录,但VNC界面无法到达登录界面的问题 问题描述 用户Ubuntu16.04系统通过SSH连接成功,但是VNC方式登录时到不了login界面。 约束与限制 本操作涉及修改grub配置文件,误操作可能会导致系统无法启动。操
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
通过移动设备登录Linux ECS 操作场景 本节操作介绍如何在移动设备上连接Linux实例。 以Termius为例介绍如何在iOS设备上连接 Linux 实例,详细操作请参考IOS设备上登录Linux云服务器。 以JuiceSSH为例介绍如何在Android设备上连接 Linux 实例,详
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
eif)。该镜像文件提供了启动QingTian Enclave实例所需要的所有信息,包括应用程序代码、运行时依赖、操作系统和文件系统等。在本节我们将说明如何创建QingTian Enclave镜像文件。 制作docker源镜像 用户将开发好的enclave应用程序及其相关的执行环境打包成doc
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
在线:Agent运行正常。 离线:Agent与HSS服务器通信异常,HSS无法提供安全防护功能。 单击“离线”,您可以查看Agent不在线的华为云主机列表,并查看“离线原因”。 防护状态 开启:HSS为该服务器提供全面的主机安全防护。 关闭:单击“关闭防护”可以暂停HSS对服务器的防护,降低该服务器的资源消耗。
以将其添加至开机启动项。具体方法请参见一键式密码重置插件启动失败时如何操作?。 一键式重置密码插件更新成功后,请勿删除重置密码进程CloudResetPwdAgent,否则,会导致一键式重装密码功能不可用。 华为云对一键式重置密码插件进行了升级,对于新创建的弹性云服务器,默认采用
支持NPU监控的规格:Ai1s, Ai2, Kai1s, Kai2。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 实例已安装对应驱动。 GPU加速型实例:已安装GPU驱动。 未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。
查看弹性云服务器详细信息(列表视图) 操作场景 在您申请了弹性云服务器后,可以通过管理控制台查看和管理您的弹性云服务器。本节介绍如何查看弹性云服务器的详细配置,包括弹性云服务器名称、镜像信息、系统盘、数据盘、虚拟私有云、网卡、安全组、弹性公网IP地址和带宽等信息。 如需查看弹性云
登录弹性云服务器查询磁盘设备信息,发现磁盘的设备名称与控制台上显示的挂载点不一致,不清楚磁盘具体挂载在哪个设备上或磁盘对应的逻辑卷标识。本节操作介绍如何根据控制台上显示的磁盘信息,查询该磁盘在弹性云服务器内对应的设备名称。 磁盘挂载相关的操作,请参见挂载磁盘。 在管理控制台查看云服务器的磁盘标识
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
若想使用优惠券,请将prepaid_options中的字段auto_pay设置为false,参考“支付包年/包月产品订单”进行支付,或者在华为云控制台使用优惠券进行支付。 不支持专属主机、专属云以及边缘云下的云服务器更换计费模式。 不支持竞价实例更换计费模式。 调试 您可以在API
以将其添加至开机启动项。具体方法请参见一键式密码重置插件启动失败时如何操作?。 一键式重置密码插件安装成功后,请勿删除重置密码进程CloudResetPwdAgent,否则,会导致一键式重装密码功能不可用。 华为云对一键式重置密码插件进行了升级,对于新创建的弹性云服务器,默认采用
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile