-
NFS服务安装与配置 - AI开发平台ModelArts
NFS服务安装与配置 NFS服务是ModelArts边缘资源池提供的数据存储卷服务,创建部署时可通过NFS挂载的方式访问共享数据,比如obs的模型文件。 涉及以下场景时,必须为资源池配置NFS服务: 创建AI应用时,元模型来源选择“从对象存储服务(OBS)中选择”,且AI引擎选择“Custom”。
-
步骤总览 - AI开发平台ModelArts
购买虚拟私有云VPC 购买弹性文件服务SFS 购买对象存储服务OBS 购买容器镜像服务SWR 创建网络 购买ModelArts专属资源池 购买弹性云服务器ECS 基本配置: 权限配置 专属资源池VPC打通 ECS服务器挂载SFS Turbo存储 在ECS中创建ma-user和ma-group
-
裸金属服务器存储指南 - AI开发平台ModelArts
服务器重启后自动挂载指南 2、对象存储服务OBS 对象存储服务是一个基于对象的存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,使用时无需考虑容量限制。 购买指南 使用指南 父主题: 存储
-
GPU A系列裸金属服务器RoCE性能带宽测试 - AI开发平台ModelArts
确定带宽 服务器A:服务端从mlx4_0网卡接收数据 ib_write_bw -a -d mlx5_0 服务器B:客户端向服务端mlx4_0网卡发送数据。 ib_write_bw -a -F 服务器A的IP -d mlx5_0 --report_gbits 图1 服务器A执行结果
-
GPU裸金属服务器环境配置 - AI开发平台ModelArts
GPU裸金属服务器环境配置 GP Vnt1裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4 GP Vnt1裸金属服务器的Docker模式环境搭建 GP Ant8裸金属服务器Ubuntu
-
GPU A系列裸金属服务器更换NVIDIA和CUDA - AI开发平台ModelArts
autoremove --purge *nccl* 删除原nccl-test的编译后文件。 由于nccl-test make编译也是基于当前cuda12.0版本的。 当cuda版本更换后,需要重新编译, 因此删除它。默认该文件在/root/nccl-tests直接删除即可。 从内核中卸载nvidia相关的所有进程。
-
GP Vnt1裸金属服务器的Docker模式环境搭建 - AI开发平台ModelArts
GP Vnt1裸金属服务器的Docker模式环境搭建 场景描述 本文指导如何在Vnt1裸金属服务器上安装Docker环境(服务器系统需为Ubuntu18.04或Ubuntu20.04)。 操作步骤 NVIDIA驱动安装。 wget https://us.download.nvidia
-
权限配置 - AI开发平台ModelArts
CommonOperations权限只能二选一,不能同时选。 SFS弹性文件服务 弹性文件服务SFS Turbo的所有权限。使用SFS服务时需要配置。 ECS弹性云服务器 弹性云服务器所有权限。使用ECS服务时需要配置。 SWR容器镜像仓库 容器镜像仓库所有权限。使用SWR服务时需要配置。同时,还需开通SWR组织权限。
-
GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4 - AI开发平台ModelArts
GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4 场景描述 本文旨在指导如何在GP Vnt1裸金属服务器上(Ubuntu 18.04系统),安装NVIDIA驱动版本470,CUDA版本11.4。 操作步骤 安装NVIDIA驱动。 apt-get
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0 - AI开发平台ModelArts
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0 场景描述 本文旨在指导完成GP Ant8裸金属服务器装机和nccl-test测试。装机软件预览如下: 表1 装机软件 软件类型 版本详情 预置操作系统 Ubuntu 20.04 server
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
nvidia-fabricmanager-${main_version}=${version}-* 验证驱动安装结果:启动fabricmanager服务并查看状态是否为“RUNNING”。 nvidia-smi -pm 1 nvidia-smi systemctl enable nvidia-fabricmanager
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 470+CUDA 11.3 - AI开发平台ModelArts
Ant系列GPU支持NvLink & NvSwitch,若您使用多GPU卡的机型,需额外安装与驱动版本对应的nvidia-fabricmanager服务使GPU卡间能够互联,否则可能无法正常使用GPU实例。 fabricmanager版本一定要和nvidia驱动版本必须保持一致。 wget
-
AI Gallery(新版) - AI开发平台ModelArts
Gallery(新版) AI Gallery简介 资产托管 资产管理 AI应用 模型微调 模型部署为推理服务 我的Gallery介绍 体验解决方案 申请购买专属昇腾AI云服务器 订阅使用 发布分享 参加活动(活动) Gallery CLI配置工具指南 使用AI Gallery SDK构建自定义模型
-
单EIP绑定裸金属服务器 - AI开发平台ModelArts
单EIP绑定裸金属服务器 弹性公网IP支持与单个裸金属服务器绑定实现公网访问和SSH登录,具体步骤可参考绑定弹性公网IP至服务器。 父主题: 网络访问
-
GP Vnt1裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
GP Vnt1裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 场景描述 本文旨在指导如何在GP Vnt1裸金属服务器上(Euler2.9系统),安装NVIDIA驱动版本515.105.01,CUDA版本11.7.1。 操作步骤 安装NVIDIA驱动。
-
删除DevServer实例 - AI开发平台ModelArts
同时支持包周期和按需; POST_PAID:按需模式; PRE_PAID: 包周期。 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints objects 实例私有IP信息。 flavor String
-
停止DevServer实例 - AI开发平台ModelArts
同时支持包周期和按需; POST_PAID:按需模式; PRE_PAID: 包周期。 cloud_server CloudServer object 云服务信息。 endpoints_response Array of Endpoints objects 实例私有IP信息。 flavor String
-
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts
昇腾云服务6.3.905版本说明 本文档主要介绍昇腾云服务6.3.905版本配套的镜像地址、软件包获取方式和支持的特性能力。 配套的基础镜像 镜像地址 获取方式 配套关系 PyTorch: 西南-贵阳一 swr.cn-southwest-2.myhuaweicloud.com/a
-
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts
昇腾云服务6.3.904版本说明 昇腾云服务6.3.904版本发布支持的软件包和能力说明如下,软件包获取路径:Support-E网站。 发布包 软件包特性说明 配套说明 备注 昇腾云模型代码 三方大模型,包名:AscendCloud-3rdLLM PyTorch框架下支持如下模型训练:
-
上传数据和算法至SFS(首次使用时需要) - AI开发平台ModelArts
上传数据和算法至SFS(首次使用时需要) 前提条件 ECS服务器已挂载SFS,请参考ECS服务器挂载SFS Turbo存储。 已经创建好,请参考在ECS中创建ma-user和ma-group。 已经安装obsutil,请参考下载和安装obsutil。 准备数据类似 登录coco数