检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
审计与日志 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务后,CTS可记录ECS的操作事件用于审计。
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
0x50014ee2b14249f6 如何查看本地盘wwn号? 登录弹性云服务器操作系统。 执行以下命令,查看wwn号。 ll /dev/disk/by-id 鲲鹏超高I/O型弹性云服务器的本地磁盘数据有丢失的风险(比如宿主机宕机或本地磁盘损坏时),如果您的应用不能做到数据可靠性
执行的变更规格任务。 是,变更规格失败,失败原因请参见后续处理。 否,变更规格成功。 步骤2:检查磁盘挂载状态 变更规格时,可能会发生磁盘挂载失败的情况,因此,变更规格后,需检查磁盘挂载状态是否正常。如果正常,则变更成功。 Windows弹性云服务器 详细操作请参考Windows云服务器变更规格后数据盘脱机怎么办?
深度诊断ECS 操作场景 ECS支持操作系统的深度诊断服务,提供GuestOS内常见问题的自诊断能力,您可以通过方便快捷的自诊断服务解决操作系统内的常见问题。 本文介绍支持深度诊断的操作系统版本以及诊断结论说明。 约束与限制 该功能依赖云运维中心(Cloud Operations
跨可用区迁移ECS 操作场景 迁移中心MgC支持主机一站式跨可用区迁移,无需手动采集、分组和评估,一站式解决创建工作流前所有步骤。ECS可以使用主机一站式跨可用区迁移功能实现跨可用区迁移。 本章节介绍在控制台的“弹性云服务器”页面配置ECS跨可用迁移的操作指导。 前提条件 已完成
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
快速入门 以下教程将引导您了解并使用QingTian Enclave特性,包括如何启动QingTian Enclave父虚拟机,如何构建QingTian Enclave镜像文件,如何查询正在运行的QingTian Enclave,以及停止QingTian Enclave。 准备一台支持QingTian
I7、Ir7n、I7n;鲲鹏超高I/O型kI1 SATA HDD本地盘:磁盘增强型D7、D6 SAS HDD本地盘:磁盘增强型D3、D2 不同规格对应本地盘的磁盘容量、读写吞吐量以及IOPS性能,请参见磁盘增强型、超高I/O型以及鲲鹏超高I/O型。 本地盘生命周期及计费 本地盘的
功能介绍 将云服务器添加到监控表中。 注册到监控表中的云服务会被ceilometer周期性采集监控数据,包括平台的版本、cpu信息、内存、网卡、磁盘、硬件平台等信息,这些数据上报给云监控。例如SAP云服务器内部的插件会周期性从云监控中查询监控数据,以报表形式呈现给SAP。 调试 您可以在API
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
原生)”章节。 extendparam 否 Object 磁盘的产品信息。 详情请参见创建磁盘的extendparam字段数据结构说明。 cluster_type 否 String 云服务器系统盘对应的磁盘存储类型。 磁盘存储类型枚举值:DSS(专属存储类型) 该参数需要与“cl
勾选“驱动器”和“其他支持的即插即用(PnP)设备”,并单击“确定”,将本地主机上的所有磁盘映射到Windows云服务器。 如果只需要映射部分本地主机上的磁盘到Windows云服务器,请展开“驱动器”,勾选待映射的磁盘设备。 图3 本地设备和资源 再次打开远程桌面连接窗口,并在“计算机”栏输入
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile
租户可以锁定自己的弹性云服务器,不能锁定其他租户的云服务器。弹性云服务器被锁定后,租户将不能再对云服务器执行管理操作,包括生命周期管理、状态管理、网卡管理、磁盘管理、密码管理等。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.1/{project_id}/serv
手工安装宝塔面板(CentOS 7.2) 应用场景 本文主要介绍了在华为云上如何在弹性云服务器的Linux实例上手工安装宝塔面板。宝塔面板是一款使用方便、功能强大且终身免费的服务器管理软件,支持Linux与Windows系统。一键配置LAMP、LNMP、网站、数据库、FTP、SS