鲲鹏-GPU加速型:计算加速型P2s

时间：2024-01-02 19:51:30

鲲鹏

计算加速型P2s

概述

P2s型弹性云服务器采用NVIDIA Tesla V100 GPU，在提供云服务器灵活性的同时，提供高性能计算能力和优秀的性价比。P2s型弹性云服务器能够提供超高的通用计算能力，适用于AI深度学习、科学计算，在深度学习训练、科学计算、计算流体动力学、计算金融、地震分析、分子建模、基因组学等领域都能表现出巨大的计算优势。

规格

表9 P2s型弹性云服务器的规格
规格名称	vCPU	内存（GiB）	最大带宽/基准带宽（Gbps）	最大收发包能力（万PPS）	网卡多队列数	网卡个数上限	GPU	GPU连接技术	显存（GiB）	虚拟化类型
p2s.2xlarge.8	8	64	10/4	50	4	4	1 × V100	PCIe Gen3	1 × 32GiB	KVM
p2s.4xlarge.8	16	128	15/8	100	8	8	2 × V100	PCIe Gen3	2 × 32GiB	KVM
p2s.8xlarge.8	32	256	25/15	200	16	8	4 × V100	PCIe Gen3	4 × 32GiB	KVM
p2s.16xlarge.8	64	512	30/30	400	32	8	8 × V100	PCIe Gen3	8 × 32GiB	KVM

P2s型弹性云服务器功能如下：

处理器：第二代英特尔® 至强® 可扩展处理器 6278，主频2.6GHz，睿频3.5GHz，或英特尔® 至强® 可扩展处理器 6151，主频3.0GHz，睿频3.4GHz。
支持开启/关闭超线程功能，详细内容请参见开启/关闭超线程。
支持NVIDIA Tesla V100 GPU卡，每台云服务器支持最大8张Tesla V100显卡。
支持NVIDIA CUDA并行计算，支持常见的深度学习框架Tensorflow、Caffe、PyTorch、MXNet等。
单精度能力14 TFLOPS，双精度能力7 TFLOPS。
支持NVIDIA Tensor Core能力，深度学习混合精度运算能力达到112 TFLOPS。
单实例最大网络带宽30Gb/s。
使用32GiB HBM2显存，显存带宽900Gb/s。
完整的基础能力：
- 网络自定义，自由划分子网、设置网络访问策略。
- 海量存储，弹性扩容，支持备份与恢复，让数据更加安全。
- 弹性伸缩，快速增加或减少云服务器数量。
灵活选择：
与普通云服务器一样，P2s型云服务器可以做到分钟级快速发放。
优秀的超算生态：
拥有完善的超算生态环境，用户可以构建灵活弹性、高性能、高性价比的计算平台。大量的HPC应用程序和深度学习框架已经可以运行在P2s实例上。

常规软件支持列表

P2s型云服务器主要用于计算加速场景，例如深度学习训练、推理、科学计算、分子建模、地震分析等场景。应用软件如果使用到GPU的CUDA并行计算能力，可以使用P2s型云服务器。常用的软件支持列表如下：

Tensorflow、Caffe、PyTorch、MXNet等常用深度学习框架
RedShift for Autodesk 3dsMax、V-Ray for 3ds Max等支持CUDA的GPU渲染
Agisoft PhotoScan
MapD

使用须知

P2s型云服务器当前支持如下版本的操作系统：
- Windows Server 2019 Standard 64bit
- Windows Server 2016 Standard 64bit
- CentOS 8.2 64bit
- CentOS 7.6 64bit
- Ubuntu Server 20.04 64bit
- Ubuntu Server 18.04
使用公共镜像创建的P2s型云服务器，默认已安装Tesla驱动。
使用私有镜像创建的P2s型云服务器，请确认在制作私有镜像时已安装Tesla驱动。如果未安装，请在创建完成后安装驱动，以实现计算加速功能。详细操作请参考安装Tesla驱动及CUDA工具包。