-
更新一键式重置密码插件(批量操作-Windows系统) - 弹性云服务器 ECS
约束与限制 需要选取一台操作系统为CentOS 8.2 (公共镜像)且已绑定弹性公网IP的云服务器作为执行机,且与待批量安装插件的弹性云服务器之间网络需要互通。 若已配置yum内部源,可不需要绑定弹性公网IP。 操作步骤 以root用户登录执行机。
-
安装一键式重置密码插件(单台操作) - 弹性云服务器 ECS
安装一键式重置密码插件(单台操作) 弹性云服务器提供一键式重置密码功能。当弹性云服务器的密码丢失或过期时,如果提前安装了一键式重置密码插件,则可以应用一键式重置密码功能,给弹性云服务器设置新密码。
-
如何处理升级内核后,驱动不可用问题 - 弹性云服务器 ECS
uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。
-
重装/切换操作系统/变更规格对磁盘数据有影响吗? - 弹性云服务器 ECS
云服务器规格无法满足业务需要时,通过变更规格,升级vCPU、内存。 是否收费 重装动作不收费。 重装前后操作系统不变,计费项不发生改变。 切换动作不收费。 切换后,系统将根据您选择的产品重新计费。 具体收费请参见产品价格详情 变更规格动作不收费。 但变更规格会引起费用的变化。
-
如何处理用户安装了GRID驱动,但未购买、配置License问题 - 弹性云服务器 ECS
如果用户未购买License,请参考GPU加速型实例安装GRID驱动购买License后再根据指导配置License。 如果用户已购买过License,但是未配置License,请参考GPU加速型实例安装GRID驱动配置License服务器与License文件。
-
Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error - 弹性云服务器 ECS
Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error 问题现象 root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation
-
更新一键式重置密码插件(批量操作-Linux系统root用户) - 弹性云服务器 ECS
使用密钥对方式鉴权的云服务器,填写方式如下: 使用密钥对方式鉴权的云服务器,请将创建弹性云服务器时保存的私钥文件,上传至与host_list.txt同一个文件夹下。 使用密钥对方式鉴权的云服务器,请确保私钥文件的权限为400。
-
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
-
通过puttygen.exe工具创建的密钥对,导入管理控制台失败怎么办? - 弹性云服务器 ECS
选择“计算 > 弹性云服务器”。 在左侧导航树中,选择“密钥对”。 在“密钥对”页面,单击“导入密钥对”。 将“.txt”格式文本文档中的公钥内容粘贴至“Public Key Content”的空白区域,并单击“OK”,导入公钥文件。 父主题: 密钥类
-
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 - 弹性云服务器 ECS
GPU加速型实例自动安装GPU驱动(Linux) GPU加速型实例自动安装GPU驱动(Windows) 如果自动安装驱动脚本中无用户需要的目标软件版本,请联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
-
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题
-
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 - 弹性云服务器 ECS
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error.
-
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? - 弹性云服务器 ECS
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? 可以,但是不建议这种部署方式。 建议将一个应用软件内的不同部件部署到同一个区域,这样不同部件之间的通信可以采用内网网络通信,既可以节省因采用公网网络通信带来的带宽费用,又可以保证不同部件之间的网络通信质量。 父主题:
-
一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办? - 弹性云服务器 ECS
问题描述 在弹性云服务器运行时,一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高。 图1 查看虚拟内存占用情况 问题根因 应用程序使用内存的时候通过glibc的内存池来提供,glibc 2.10之前的版本中,只有一个内存池,称为main arena。
-
EIP资源在什么情况下会被冻结,如何解除被冻结的EIP资源? - 弹性云服务器 ECS
EIP绑定的实例对外有攻击被冻结 EIP资源绑定的服务器如果对外有攻击等安全违规行为,即被冻结状态,在控制台上显示为冻结(违规冻结)。被冻结的资源不可用,也不能修改、删除。若要解除冻结状态,请提交工单。 您可以参考更换弹性公网IP为实例更换EIP。
-
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS
处理方法 如果用户未安装驱动,请自行安装驱动,或切换带驱动的公共镜像,或使用驱动自动安装脚本安装驱动: GPU加速型实例自动安装GPU驱动(Linux) GPU加速型实例自动安装GPU驱动(Windows) 如果用户已安装驱动,但驱动不匹配使用场景,请卸载驱动后重新安装。
-
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) - 弹性云服务器 ECS
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC
-
NetworkManager服务无法启动,报错:Failed to restart NetuorkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS
NetworkManager服务无法启动,报错:Failed to restart NetuorkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错:Failed to restart
-
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 - 弹性云服务器 ECS
版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。 若显示适配器恢复正常,则恢复完成。 若仍异常,则执行下一步。 请尝试重装GPU驱动或升级驱动版本。请参考安装GPU驱动。
-
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用