弹性云服务器 ECS-鲲鹏AI推理加速型:鲲鹏AI推理加速增强I型kAi1s

时间:2024-11-11 19:03:26

鲲鹏AI推理加速增强I型kAi1s

概述

鲲鹏AI推理加速型实例kAi1s是以昇腾310(Ascend 310)芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力AI推理业务的快速普及。通过AI推理加速型实例kAi1s将Ascend 310芯片的计算加速能力在云平台上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。

鲲鹏AI推理加速型实例kAi1s基于Atlas 300I加速卡设计,更多详细信息请参考昇腾社区

鲲鹏AI推理加速型云服务器可用于机器视觉、 语音识别 自然语言处理 通用技术,支撑智能零售、智能园区、机器人云大脑、平安城市等场景。

规格

表2 kAi1s型弹性云服务器的规格

规格名称

vCPU

内存

(GiB)

最大带宽/基准带宽

最大收发包能力

(万/PPS)

网卡多队列数

网卡个数上限

Ascend 310个数

虚拟化类型

kai1s.xlarge.1

4

4

3/0.8

20

2

2

1

KVM

kai1s.2xlarge.1

8

8

4/1.5

40

2

3

2

KVM

kai1s.4xlarge.1

16

16

6/3

80

4

4

4

KVM

kai1s.3xlarge.2

12

24

8/4

100

4

4

4

KVM

kai1s.4xlarge.2

16

32

10/6

140

4

5

6

KVM

kai1s.6xlarge.2

24

48

12/8

200

8

6

8

KVM

kai1s.9xlarge.2

36

72

12/8

200

8

6

12

KVM

kai1s.12xlarge.2

48

96

12/8

200

16

6

12

KVM

功能

kAi1s加速型弹性云服务器功能如下:

  • 处理器与内存配比为1:1/1:2。
  • 处理器:Kunpeng 920 2.6GHz。
  • 支持Ascend310芯片,每张Atlas 300I加速卡包含4个Ascend310芯片。
  • 单芯片半精度(FP16)8TeraFLOPS。
  • 单芯片整数精度(INT8)16TeraOPS。
  • 单芯片提供8GiB显存,内存带宽50GiB/s。
  • 内置硬件视频编解码引擎, 支持H.264/265。

使用须知

  • kAi1s实例支持如下版本的操作系统:
    • Ubuntu Server 18.04 64bit
    • CentOS 7.6 64bit
  • kAi1s型云服务器所在物理机发生故障时,云服务器支持自动恢复。

如何使用kAi1s加速型云服务器

购买与使用kAi1s加速型云服务器的流程如下:

  1. 创建云服务器,详细步骤,请参考步骤一:基础配置
    • 在“规格”设置时,选择kAi1s加速型相关规格。
    • 在“镜像”设置时,可以选择“公共镜像”和“私有镜像”。
      • 公共镜像:已经默认安装了CANN 3.1.0的开发套件包,并配置了环境变量,请验证环境的可用性。
      • 私有镜像:需要安装驱动、固件和开发套件,并配置环境变量。详细步骤,请参考昇腾文档中心对应版本的《CANN软件安装指南》。
  2. 远程登录云服务器。

    对于Linux操作系统的云服务器,登录时请以SSH密码方式登录。具体操作,请参见密码方式登录Linux弹性云服务器(SSH方式)

  3. 验证环境可用性。

    请参考昇腾文档中心中对应CANN版本《应用开发指南》中的“样例使用指导”,选择一个样例进行编译运行,验证环境的正确性。

    例如,选择“基于Caffe ResNet-50网络实现图片分类(图片解码+缩放+同步推理)”样例进行验证。

support.huaweicloud.com/productdesc-ecs/ecs_01_0048.html