检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing,
Linux镜像安装一键式重置密码插件启动失败怎么办? 操作场景 Linux镜像安装一键式重置密码插件启动失败,请参考本章节处理。 问题描述 用户通过执行命令sudo sh setup.sh安装一键式重置密码插件,有如下报错: begin install CloudResetPwdAgent
Tesla驱动及CUDA工具包获取方式 操作场景 使用GPU加速型云服务器时,需确保已安装Tesla驱动和CUDA工具包,否则无法实现计算加速功能。本节内容提供Tesla驱动及CUDA工具包下载地址,请根据实例的类型,选择具体的驱动版本。 Tesla驱动及CUDA工具包安装操作指
(推荐)自动安装GPU加速型ECS的GPU驱动(Linux) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Linux实例上通过脚本自动安装GPU驱动。 使用须知 本操作仅支持Linux操作系统。
: Fri Aug 23 10:00:13 2019 Begin rpmdb : 384:1c8e3df918de17e245b0dd7195f06f89656c5f27 End time : 10:02:22 2019 (129 seconds)
如何处理Nouveau驱动未禁用导致的问题 问题描述 Nouveau驱动未禁用可能导致Linux系统卡死、虚拟机无法远程登录等问题。一般常见于客户使用自己的私有镜像(从ECS普通虚拟机导出的镜像或其他来源的私有镜像)。 判断方式 执行以下命令,查看Linux内核环缓冲区中的错误关键字信息。
如何使用自动化工具配置华为云镜像源(x86_64和鲲鹏)? 操作场景 更新弹性云服务器的系统或者软件时,可以连接Internet,通过外部镜像源提供相关服务。但是,如果弹性云服务器无法访问Internet,或者外部镜像源提供的服务不稳定时,可以使用华为云提供的一键配置脚本完成镜像源配置并进行更新。
怎样查询弹性云服务器使用的密钥对是哪个? 问题描述 如果用户创建了多个密钥对,在登录弹性云服务器时,可能会迷惑哪一个密钥对才是正确的。此时,可以通过登录管理控制台,快速查询弹性云服务器使用的密钥对信息。 操作步骤 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 选择“计算
(推荐)通过管理控制台创建密钥对 操作场景 您可以通过管理控制台创建密钥对,创建完成后,公钥自动保存在系统中,私钥由用户保存在本地。 操作步骤 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 单击“”,选择“计算 > 弹性云服务器”。 在左侧导航树中,选择“密钥对”。
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 问题描述 Linux操作系统的ECS实例发生异常重启事件,错误提示如下: Kernel panic - not syncing: NMI: Not continuing 同时,内核日志打印如下信息:
在Windows ECS上使用OBS Browser+通过内网访问OBS OBS Browser+是一款用于访问和管理对象存储服务的图形化工具,支持通过配置内网DNS服务器地址的方式,使在华为云上的Windows ECS通过内网直接访问OBS,下面将介绍具体其操作流程和操作步骤。
(推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Windows实例上通过脚本自动安装GPU驱动。 使用须知 如果GPU加速型实例已安
ces" }, "region_id": "xxx", "project_id": "6e8b0c94265645f39c5abbe63c4113c6", "name": "ecs-ddd4" } User data(OpenStack元数据API) 用
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
同一个VPC内的ECS内网无法互通或者出现丢包等现象时,如何排查? 问题描述 同一个VPC内的两台弹性云服务器无法互通或者出现丢包等现象。 排查思路 以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。 如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
获取ECS一键式重置密码插件 操作场景 若弹性云服务器“重置密码”失败,有可能是由于未安装一键式重置密码插件或插件失效,您可以参考本章节获取一键式重置密码插件并校验其完整性。 获取并校验一键式重置密码插件完整性(Linux) 以root用户登录弹性云服务器。 执行以下命令,下载一键式重置密码插件及sha256校验码。
弹性云服务器重启后,主机名被还原为安装时的主机名? 以CentOS 7操作系统的弹性云服务器为例: 登录Linux弹性云服务器,查看“cloud-init”的配置文件。 检查“/etc/cloud/cloud.cfg”文件中“update_hostname”是否被注释或者删除。如果没有被注释或者删除,则需要注释或删除
创建弹性云服务器时,选择“文本”形式并输入实例自定义数据,脚本如下: rem cmd echo "Hello, BAT Test" > C:\1111.txt 创建成功后,连接并启动弹性云服务器,查看脚本的运行结果:在C:\盘添加了一个名称为 “1111” 的文本文档,如图3所示。 图3 新建文本文档_Batch 如
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messa