检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
密钥生成器将自动生成一对公钥和私钥,其中,图2的红框内容为生成的公钥文件。 图2 生成公钥和私钥文件 复制红框中的公钥内容,并将其粘贴在文本文档中,以.txt格式保存在本地,保存公钥文件。 请勿直接单击“Save public key”保存公钥文件。因为通过puttygen.exe工具的“Save public
本地连接:网卡名称,需要根据实际正在使用的网卡进行修改。 备选DNS服务器地址:是在首选DNS服务器出现故障、不可用或无法解析请求的域名时使用的DNS服务器,因此您可以设置为华为云内网DNS服务器的地址(需要根据ECS所在区域选择内网DNS服务器地址,具体的地址信息请参见华为云提供的内网DNS服务器地
执行以下命令,查看ECS实例内核参数kernel.unknown_nmi_panic的值。 sysctl -n kernel.unknown_nmi_panic 如果内核参数的取值为1,说明是由于内核参数配置错误引起的ECS实例异常重启。 图1 排查结果 执行以下命令,查看是否存在内核参数kernel
root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation error。 根因分析 出现该问题通常是密码文件的属性的问题导致,也有可能是根目录空间满。 执行以下命令查看存放用户和密码的文件(/etc/passwd和/etc/shadow)属性。
回显结果中出现No表示不存在待隔离页。 如果1的回显结果中volatile Uncorr. ECC下ecc error = 0,执行以下命令,查看所有的卡是否存在待隔离页。 nvidia-smi -q -d PAGE_RETIREMENT 如果3的回显结果中Pending Page Bl
如果创建弹性云服务器时未注入自定义数据,此时,该接口的查询结果是404,如图1所示。 图1 404 Not Found Network data(OpenStack元数据API) 查询弹性云服务器的网络信息,支持查询云服务器挂载的全部网卡的信息,包括网卡所在子网的DNS地址、网络带宽、网卡ID、网
应用程序使用内存的时候通过glibc的内存池来提供,glibc 2.10之前的版本中,只有一个内存池,称为main arena。从glibc 2.10版本开始引入了thread arena,导致虚拟内存VIRT和常驻内存SHR过高。可通过限制一键式重置密码插件的可申请内存解决该问题。
/etc/hosts查看脚本的运行结果。 图2 查看运行结果 关于Windows弹性云服务器的实例自定义数据脚本 Windows弹性云服务器的实例自定义数据脚本(简称“脚本”)采用开源的cloudbase-init架构实现,该架构以弹性云服务器的元数据为数据来源,对弹性云服务器
4位,参考表1选择对应的下载地址。 为了便于您通过内网下载一键式重置密码插件,我们提供了不同区域的下载地址,不同区域、相同操作系统的插件相同。 如果表1中不包含您的弹性云服务器所在区域,请您为弹性云服务器绑定EIP,然后选择就近区域进行下载。 绑定EIP的详细操作,请参见绑定弹性公网IP。
主机IP:主机的IP。 操作系统:主机的操作系统,例如Linux。 登录账号:登录主机的账号。建议使用root账号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。 连接测试结果:测试安装机和需安装主机间的网络连通性以及密码正确性。
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messages日志发现有如下报错,
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
NetworkManager服务无法启动,报错:Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错:Failed to restart
件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。
可能是因为显卡过热,用户先停止业务,待显卡缓解过热后再执行nvidia-smi命令,查看ERR!是否消失。 如果回显正常,建议用户调整下业务,限制显卡运行的最大功率。 如果仍未恢复正常,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
host_list.txt 将需要自动安装驱动的云服务器的相关信息填写到host_list.txt文件中。 文件填写格式与登录待切换弹性云服务器的方式需要匹配。 使用密钥对方式鉴权的云服务器,填写方式如下: 使用密钥对方式鉴权的云服务器,请将创建弹性云服务器时保存的私钥文件,上传至与host_list
操作场景 当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。 执行机应该与待更新机器在同一VPC下。
stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。 79 GPU has fallen off the bus。总线脱落,需要下线维修 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/
问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile Uncorr. ECC下ecc error > 0,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。 如果在volatile
问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。