检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持NVIDIA Tesla P4 GPU卡,单实例最大支持4张P4 GPU卡。 提供GPU硬件直通能力。 单GPU单精度计算能力最高5.5 TFLOPS。 单GPU INT8计算能力最高22 TOPS。 单GPU提供8GiB ECC显存,带宽192GiB/s。 GPU内置硬件视频编解码引擎,
模式下,GPU同时用于计算和图形。 仅在GPU服务器安装了GRID驱动时才可以切换至WDDM模式。 关于TCC和WDDM,了解更多。 方法二 登录GPU加速型云服务器。 下载gpu-Z并安装。 打开gpu-z,选择“Sensors”即可查看GPU使用情况。 图2 GPU使用率 父主题:
(推荐)自动安装GPU加速型ECS的GPU驱动(Linux) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Linux实例上通过脚本自动安装GPU驱动。 使用须知 本操作仅支持Linux操作系统。
GPU驱动概述 GPU驱动概述 在使用GPU加速型实例前,请确保实例已安装GPU驱动以获得相应的GPU加速能力。 GPU加速型实例支持两种类型的驱动:GRID驱动和Tesla驱动。 当前已支持使用自动化脚本安装GPU驱动,建议优先使用自动安装方式,脚本获取以及安装指导请参考(推荐
(推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 操作场景 在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。 本节内容介绍如何在GPU加速型Windows实例上通过脚本自动安装GPU驱动。 使用须知 如果GPU加速型实例已安装
本节操作介绍GPU云服务器安装Tesla驱动及CUDA工具包的操作步骤。 当前已支持使用自动化脚本安装GPU驱动,建议优先使用自动安装方式,脚本获取以及安装指导请参考(推荐)自动安装GPU加速型ECS的GPU驱动(Linux)和(推荐)自动安装GPU加速型ECS的GPU驱动(Windows)。
NVIDIA支持用户申请90天试用版License。 不同规格的GPU实例介绍和应用场景请参见GPU加速型。 购买GRID License 购买License 如果需要正式版本License,请联系NVIDIA或者所在国家/地区的NVIDIA代理商。 申请试用版License。 打开NVIDIA官方网站,填写相关信息。
方法一:重新启动,选择安装GPU驱动时的内核版本,即可使用GPU驱动。 在云服务器操作列下单击“远程登录 > 立即登录”。 单击远程登录操作面板上方的“发送CtrlAltDel”按钮,重启虚拟机。 然后快速刷新页面,按上下键,阻止系统继续启动,选择安装GPU驱动时的内核版本进入系统
T4 GPU设备显示异常 问题描述 使用NVIDIA Tesla T4 GPU的云服务器,例如Pi2或G6规格,执行nvidia-smi命令查看GPU使用情况时,显示如下: No devices were found 原因分析 NVIDIA Tesla T4 GPU是NVIDIA的新版本,默认使用并开启GSP
G系列弹性云服务器GPU驱动故障 问题描述 在Windows系统的G系列弹性云服务器中,无法打开NVIDIA 控制面板,GPU驱动无法使用或GPU驱动显示异常。 可能原因 GPU驱动状态异常。 处理方法 打开Windows设备管理器,在显示适配器中查看GPU驱动状态。 GPU驱动显示正常
是,该驱动版本与镜像可能存在兼容性问题,建议更换驱动版本,操作指导,请参考安装GPU驱动。 否,请执行下一步。 请尝试重启云服务器,再执行nvidia-smi查看GPU使用情况,确认是否正常。 如果问题依然存在,请联系客服。 父主题: GPU驱动故障
GPU实例故障处理流程 GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
管理GPU加速型ECS的GPU驱动 GPU驱动概述 Tesla驱动及CUDA工具包获取方式 (推荐)自动安装GPU加速型ECS的GPU驱动(Linux) (推荐)自动安装GPU加速型ECS的GPU驱动(Windows) 手动安装GPU加速型ECS的GRID驱动 手动安装GPU加速型ECS的Tesla驱动
卸载GPU加速型ECS的GPU驱动 操作场景 当GPU加速型云服务器需手动卸载GPU驱动时,可参考本文档进行操作。 GPU驱动卸载命令与GPU驱动的安装方式和操作系统类型相关,例如: Windows操作系统卸载驱动 Linux操作系统卸载驱动 Windows操作系统卸载驱动 以Windows
处理方法 如果未安装GPU驱动,请重新安装GPU驱动。 操作指导请参考:安装GPU驱动 如果已安装驱动,但是驱动被卸载。 执行history,查看是否执行过卸载操作。 进入/var/log目录,查看是否有nvidia-uninstall.log日志,如果有说明GPU驱动已被卸载,请重新安装GPU驱动。
移出云服务器组后重新启动。 弹性云服务器包含本地盘(如磁盘增强型、H2型、P1型、P2型)、NVMe SSD本地磁盘(如超高I/O型)、GPU卡(如G3型)、FPGA卡(如fp1型、fp1c型),则无法在创建后加入云服务器组,如需使用云服务器组功能,请在创建时选择云服务器组。 登录管理控制台。
GPU实例故障分类列表 GPU实例故障的分类列表如表1所示。 表1 GPU实例故障分类列表 是否可恢复故障 故障类型 相关文档 可恢复故障,可按照相关文档自行恢复 镜像配置问题 如何处理Nouveau驱动未禁用导致的问题 ECC错误 如何处理ECC ERROR:存在待隔离页问题 内核升级问题
华为云有没有提供NTP服务器,怎样配置? 有,该NTP服务器仅限于在华为云控制台上购买的弹性云服务器配置使用。 如需在购买的弹性云服务器上配置NTP服务器,您可以选择使用华为云控制台自己提供的NTP服务器,也可以选择其他NTP服务器。配置NTP服务器的操作相同,本节以华为云控制台
将ECS迁移至专属主机 操作场景 云平台支持弹性云服务器在专属主机与公共资源池之间迁移。 在控制台的“弹性云服务器”页面,您可以将公共资源池的弹性云服务器迁移至专属主机,成为专属主机上的弹性云服务器。 本章节介绍公共资源池的弹性云服务器迁移至专属主机的操作指导。 迁移云服务器需保
Server)是一种可随时自助获取、可弹性伸缩的云服务器,可帮助您打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率。 免费体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转ECS 01 了解 了解华为云弹性云服务器的应用场景和实例详情,有助于您更准确地匹