弹性云服务器 ECS-GPU加速型:计算加速型P1

时间:2024-08-30 18:48:36

计算加速型P1

概述

P1型弹性云服务器采用NVIDIA Tesla P100 GPU,在提供云服务器灵活性的同时,提供优质性能体验和优良的性价比。P1型弹性云服务器支持GPU Direct技术,实现GPU之间的直接通信,提升GPU之间的数据传输效率。能够提供超高的通用计算能力,在深度学习、图形数据库、高性能数据库、计算流体动力学、计算金融、地震分析、分子建模、基因组学等领域都能表现出巨大的计算优势,适用于科学计算等。

规格

表11 P1型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽(Gbps)

最大收发包能力(万PPS)

网卡多队列数

GPU

显存

(GiB)

本地盘

(GiB)

虚拟化类型

p1.2xlarge.8

8

64

5/1.6

35

2

1 × P100

1 × 16

1 × 800

KVM

p1.4xlarge.8

16

128

8/3.2

70

4

2 × P100

2 × 16

2 × 800

KVM

p1.8xlarge.8

32

256

10/6.5

140

8

4 × P100

4 × 16

4 × 800

KVM

P1型弹性云服务器功能如下:
  • 处理器:英特尔® 至强® 处理器 E5-2690 v4,主频2.6GHz,睿频3.5GHz。
  • 支持开启/关闭超线程功能,详细内容请参见开启/关闭超线程
  • 支持NVIDIA Tesla P100 GPU卡,单实例最大支持4张P100显卡,如果需要使用单机8张P100显卡,可以使用裸金属服务器。
  • 提供GPU硬件直通能力。
  • 单精度能力9.3 TFLOPS,双精度能力4.7 TFLOPS。
  • 最大网络带宽10Gb/s。
  • 使用16GiB HBM2显存,显存带宽732Gb/s。
  • 使用800GiB的NVMe SSD卡作为本地临时存储。
  • 完整的基础能力:
    • 网络自定义,自由划分子网、设置网络访问策略。
    • 海量存储,弹性扩容,支持备份与恢复,让数据更加安全。
    • 弹性伸缩,快速增加或减少云服务器数量。
  • 灵活选择:

    与普通云服务器一样,P1型云服务器可以做到分钟级快速发放。用户可以根据业务规模灵活选择规格,后续将逐步支持1:2、1:4、1:8规格云服务器的创建。

  • 优秀的超算生态:

    拥有完善的超算生态环境,用户可以构建灵活弹性、高性能、高性价比的计算平台。大量的HPC应用程序和深度学习框架已经可以运行在P1实例上。

常规支持软件列表

P1型云服务器主要用于计算加速场景,例如深度学习训练、推理、科学计算、分子建模、地震分析等场景。应用软件如果使用到GPU的CUDA并行计算能力,可以使用P1型云服务器。常用的软件支持列表如下:

  • Tensorflow、Caffe、PyTorch、MXNet等深度学习框架
  • RedShift for Autodesk 3dsMax、V-Ray for 3ds Max
  • Agisoft PhotoScan
  • MapD
使用须知
  • P1型云服务器的系统盘大小建议大于40GiB。
  • P1型云服务器包含NVMe SSD本地盘,关机后仍然收费,如果停止计费,需删除弹性云服务器。
  • P1型 云服务器配置 了NVMe SSD本地盘,专为深度学习训练、HPC高性能计算等对存储I/O性能有极高要求的业务场景设计。本地盘与特定规格的云服务器绑定,不可单独购买,不可卸载并挂载到另一台云服务器上使用。

    P1型云服务器配置的NVMe SSD本地盘有丢失数据的风险(比如NVMe SSD故障或宿主机故障时),强烈建议您在本地NVMe SSD磁盘中存放临时数据,如需存放重要数据,请做好数据备份。

  • P1型弹性云服务器不支持规格变更。
  • P1型弹性云服务器不支持自动恢复功能:
    • 部分宿主机硬件故障或亚健康等场景,需要用户配合关闭E CS 完成宿主机硬件维修动作。
    • 因系统维护或硬件故障等,HA重新部署ECS实例后,实例会冷迁移到其他宿主机,本地盘数据不保留。
  • 删除P1型弹性云服务器后,本地NVMe SSD磁盘的数据会被自动清除。
  • 使用公共镜像创建的P1型云服务器,默认已安装Tesla驱动。
  • 使用私有镜像创建的P1型云服务器,请确认在制作私有镜像时已安装Tesla驱动。如果未安装,请在云服务器创建完成后安装驱动,以实现计算加速功能。详细操作请参考安装Tesla驱动及CUDA工具包
  • GPU型弹性云服务器因通用算力和异构算力差异大,仅支持变更规格至同类型规格内的细分规格。
  • GPU型弹性云服务器不支持热迁移。
support.huaweicloud.com/productdesc-ecs/ecs_01_0045.html