检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
com/deploy/xid-errors/index.html。 处理方法 尝试重新运行作业并观察Xid错误是否消失。 若错误持续存在,尝试检查代码或分析日志,确认是否为程序引入的Xid故障。 若确认不是程序引入,请联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
明Nouveau驱动已禁用。 如果回显信息中包含nouveau关键字样,说明Nouveau驱动已安装,则需要禁用Nouveau驱动。 处理方法 执行如下命令编辑blacklist.conf文件。 如果没有“/etc/modprobe.d/blacklist.conf”文件,请新建一个。
通过SSH密钥方式登录Linux ECS 操作场景 本节操作介绍在Windows和Linux环境中使用SSH密钥对方式远程登录Linux云服务器的操作步骤。 前提条件 已获取创建该弹性云服务器时使用的密钥对私钥文件,创建密钥对请参见(推荐)通过管理控制台创建密钥对。 弹性云服务器
位状态正常(rev a1),请继续按照处理方法处理;如果查找不到显卡或者显示状态为rev ff,请根据显卡故障诊断及处理方法进行故障诊断。规格对应显卡数量可以通过GPU加速型查询。 lspci | grep -i nvidia 处理方法 非CCE集群场景,建议尝试自行重装驱动,或
通过配置的Sharepoint管理中心的URL,打开SharePoint的管理中心。 图1 SharePoint管理中心 选择Sharepoint Farm的配置方法,本操作采用自主配置,单击“Cancel”。 若想要通过向导配置Sharepoint Farm,可以单击"Start the Wizard"。
AI加速型 AI加速型云服务器(AI Accelerated Cloud Server,AIACS)是专门为AI业务提供加速服务的云服务器。搭载昇腾系列芯片及软件栈。 该类型弹性云服务器默认开启超线程,每个vCPU对应一个底层超线程HT(Hyper-Threading)。 AI推
com/deploy/xid-errors/index.html。 处理方法 执行dmesg | grep –i xid命令,查看是否存在xid报错。 通知用户停止业务,执行业务迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
_id}/os-interface 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 server_id 是 云服务器ID。 请求消息 请求参数如表2所示。 表2 请求参数 参数 是否必选 参数类型 描述
如客户选择自行安装Tesla驱动,请务必告知客户确保Tesla驱动与CUDA软件的版本配套关系,可参考Tesla驱动及CUDA工具包获取方式。 处理方法 如果用户未安装驱动,请自行安装驱动,或切换带驱动的公共镜像,或使用驱动自动安装脚本安装驱动。 GPU加速型实例自动安装GPU驱动(Linux)
可能影响ECC相关非易失数据的记录,导致本该隔离的GPU内存页面继续使用。 处理方法 如果用户业务暂未受损,则无需处理。 通知用户停止业务,执行虚拟机迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
绑定弹性网卡 操作场景 当您的弹性云服务器需要多个弹性网卡时,可以参考下面步骤为弹性云服务器绑定弹性网卡。 操作步骤 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 单击“”,选择“计算 > 弹性云服务器”。 单击待绑定弹性网卡的弹性云服务器名称。 系统跳转至该弹性云服务器详情页面。
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障信息收集
描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 keypair_name 是 密钥名称。 请求消息 无 响应消息 无 请求示例 删除名称为“KeyPair-123”的SSH密钥。 DELETE https://{endpoint}/v2.1/{proje
rs/{keypair_name} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 keypair_name 是 密钥名称信息。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 参数类型
vailability_zone} 参数说明请参见表1。 表1 路径参数 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 表2 查询参数 参数 是否必选 参数类型 描述 availability_zone 否 String 可用区,需要指
set:”选择“UTF-8”。 单击“Open”。 如果首次登录服务器,PuTTY会显示安全警告对话框,询问是否接受服务器的安全证书。单击“是”将证书保存到本地注册表中。 建立到云服务器的SSH连接后,根据提示输入用户名和密码登录云服务器。 如果是公共镜像(包括CoreOS),首次登录时,登录用户名、密码如下:
能表现差;查看/var/log/messages日志发现有如下报错,询问用户后确认用户购买了License但是未配置License。 处理方法 确认用户业务使用场景是否是做图形处理,用户使用的实例规格是否满足图形处理要求。 用户是否安装GRID驱动,执行nvidia-smi命令查询回显是否正常。
NVIDIA驱动空指针访问 可能原因 GPU驱动异常。 处理方法 卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis nvidia
/v1/{project_id}/availability-zones 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 参数类型 描述 availability_zones
_id}/autorecovery 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 server_id 是 云服务器ID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 参数类型