检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
建磁盘分区设置为开机自动挂载,请参见设置开机自动挂载磁盘分区。 设置开机自动挂载磁盘分区 您可以通过配置fstab文件,设置云服务器系统启动时自动挂载磁盘分区。已有数据的云服务器也可以进行设置,该操作不会影响现有数据。 本文介绍如何在fstab文件中使用UUID来设置自动挂载磁盘
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messa
手工部署Node.js(CentOS 7.2) 简介 本文介绍了如何在华为云上使用弹性云服务器的Linux实例部署Node.js。 Node.js是一个基于Chrome V8引擎的JavaScript运行环境,用于方便地搭建响应速度快、易于扩展的网络应用。Node.js使用事件驱
如何解决Ubuntu 16.04云服务器可以通过SSH成功登录,但VNC界面无法到达登录界面的问题 问题描述 用户Ubuntu16.04系统通过SSH连接成功,但是VNC方式登录时到不了login界面。 约束与限制 本操作涉及修改grub配置文件,误操作可能会导致系统无法启动。操
EIP资源在什么情况下会被冻结,如何解除被冻结的EIP资源? EIP资源在如下情况会被冻结: 欠费被冻结 包年/包月EIP资源 保留期,指宽限期到期后客户的包年/包月资源仍未续订,将进入保留期。保留期即被冻结状态。被冻结的资源不可用,也不能修改、删除。超过保留期仍未续费,冻结资源
但对您的服务端状态没有影响。 返回结果状态码为4xx时,重试不会成功。您需要根据错误信息排查问题后再重试请求。 支持幂等设置的API列表 以下API支持设置X-Client-Token请求头,保证请求幂等性。 创建云服务器 创建云服务器(按需) 父主题: 附录
CentOS/EulerOS设置系统时区 操作场景 本节操作介绍在CentOS或EulerOS操作系统云服务器设置时区的操作步骤。 约束与限制 该文档已在CentOS 6.8及CentOS 7.5操作系统云服务器上验证,其他版本可能存在差异。 文档中以中国上海时区为例,其他时区请根据实际进行设置。 CentOS
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
变更规格后,查看磁盘挂载情况,如图2所示。 图2 变更规格后磁盘挂载情况 只查询到1块系统盘,因此,变更规格前、后,显示的磁盘个数不一致,表示数据盘处于“脱机”状态。 将磁盘设置为“联机”状态。 选择“开始”菜单,右键单击“计算机”,并选择“管理”。 系统弹窗显示“服务器管理器”页面。 在左侧导航栏,选择“存储 >
近1周的操作事件,也可以自定义最近7天内任意时间段的操作事件。 您可以参考云审计服务应用示例,来学习如何查询具体的事件。 在事件列表页面,您还可以导出操作记录文件、刷新列表、设置列表展示信息等。 在搜索框中输入任意关键字,按下Enter键,可以在事件列表搜索符合条件的数据。 单击“导出”按钮,云审计服务会将查询结果以
CS的日常维护。 例如,如果您想批量在ECS上安装或卸载软件、重置密码或执行自动化运维脚本,即可通过免登录发送命令功能进行操作。 本文介绍如何通过管理控制台向单台或多台ECS发送命令。 约束与限制 该功能依赖云运维中心(Cloud Operations Center,简称COC),需开通并授权COC服务。
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
表示新建分区“dev/vdb1”已挂载至“/mnt/sdc”。 设置开机自动挂载磁盘分区 您可以通过配置fstab文件,设置弹性云服务器系统启动时自动挂载磁盘分区。已有数据的弹性云服务器也可以进行设置,该操作不会影响现有数据。 本文介绍如何在fstab文件中使用UUID来设置自动挂载磁盘分区。不建议采用在“/
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
disk服务,执行完毕后会退出diskpart,停用virtual disk服务。由于系统内置WinVMDataDiskAutoInitialize.ps1设置开机自启动和客户数据库业务开机自启动时间段重叠了,可能会导致I/O操作错误。 数据库使用Windows API的(例如 ReadFile、