AI开发平台MODELARTS-GPT-2基于Server适配PyTorch GPU的训练推理指导:环境准备

时间:2024-11-08 16:58:59

环境准备

在华为云ModelArts Server预购相关超强算力的GPU裸金属服务器,并选择AIGC场景通用的镜像,完成使用Megatron-Deepspeed训练GPT2模型。本最佳实践使用以下镜像和规格:

  • 镜像选择:Ubuntu 20.04 x86 64bit SDI3 for Ant8 BareMetal with RoCE and NVIDIA-525 CUDA-12.0。
  • 裸金属规格选择: GP Ant8,包含8张GPU卡以及8张RoCE网卡。

关于Ant8裸金属服务器的购买,可以在华为云官网提工单至ModelArts云服务, 完成资源的申请。

support.huaweicloud.com/usermanual-server-modelarts/usermanual-server-0015.html