-
创建相同帐户下的VPC对等连接 - AI开发平台ModelArts
创建相同帐户下的VPC对等连接 对等连接是建立在两个VPC之间的网络连接,不同VPC之间网络不通,通过对等连接可以实现同一个区域下的不同VPC之间的云上内网通信。 本章节指导用户创建相同帐户下的VPC对等连接,即连通的两个VPC位于同一个帐户下。 详细操作请参见:创建相同帐户下的对等连接。
-
GP Ant1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Ant1裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:EulerOS2.10 x86 64bit sdi3 for Ant1 BareMetal 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 64bit 架构类型 x86 RoCE路由配置
-
NPU Snt9B裸金属服务器环境配置 - AI开发平台ModelArts
NPU Snt9B裸金属服务器环境配置 场景描述 物理机环境配置 容器化个人调测环境搭建 父主题: 环境配置
-
NPU Snt9B集合通信算子多机多卡性能测试指导 - AI开发平台ModelArts
NPU Snt9B集合通信算子多机多卡性能测试指导 场景描述 本文介绍如何使用在2台NPU Snt9B服务器上进行集合通信算子多机性能测试,包括的集合通信算子:allreduce、reducescatter、allgather、all2all。 本文选择的服务器镜像是:EulerOS-2
-
使用ma-cli dli-job upload命令上传文件到DLI分组资源 - AI开发平台ModelArts
使用ma-cli dli-job upload命令上传文件到DLI分组资源 ma-cli dli-job upload命令支持将本地文件或OBS文件上传到DLI资源组。 $ ma-cli dli-job upload -h Usage: ma-cli dli-job upload
-
Step1 创建OBS桶和文件夹 - AI开发平台ModelArts
code/ 用于存储Ascend训练脚本文件。 obs://test-modelarts/ascend/demo-code/run_ascend/ 用于存储Ascend训练脚本的启动脚本。 obs://test-modelarts/ascend/log/ 用于存储训练日志文件。 父主题:
-
不在同一个主账号下,如何使用他人的自定义镜像创建Notebook? - AI开发平台ModelArts
不在同一个主账号下,如何使用他人的自定义镜像创建Notebook? 不是同一个主账号,用户A需要使用用户B的自定义镜像创建Notebook,此时需要用户B将此镜像共享给用户A,用户A将此共享镜像Pull下来注册后方可在Notebook中使用。详细操作如下: 用户B的操作: 登录容
-
NPU Snt9B裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9B裸金属服务器支持的镜像详情 镜像名称:EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.10 内核版本 Linux 4
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 470+CUDA 11.3 - AI开发平台ModelArts
version=470.182.03 main_version=$(echo $version | awk -F '.' '{print $1}') apt-get update apt-get -y install nvidia-fabricmanager-${main_version}=${version}-*
-
连接远端开发环境时,一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上,如何解决? - AI开发平台ModelArts
mv vscode-server-linux-arm64/* ${commitID} 重新远程连接。 父主题: VS Code连接开发环境失败常见问题
-
连接远端开发环境时,一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上,如何解决? - AI开发平台ModelArts
关闭VS Code所有窗口后,回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。 父主题: VS Code连接开发环境失败常见问题
-
NVIDIA和CUDA驱动安装指南 - AI开发平台ModelArts
NVIDIA和CUDA驱动安装指南 场景描述 本文介绍如何华为云裸金属服务器中安装NVIDIA和CUDA驱动(以Ant8规格为例)。 1、安装NVIDIA驱动 打开NVIDIA官方网站。 根据Ant8的详细信息和您所需的cuda版本选择驱动 图1 驱动选择 选择后会自动出现Driver版本并下载,或者直接。
-
NPU Snt9B裸金属服务器多机批量执行命令 - AI开发平台ModelArts
NPU Snt9B裸金属服务器多机批量执行命令 场景描述 在使用NPU Snt9B裸金属服务器进行多机训练/推理作业时,往往需要将多机的环境配置的完全一致。如果逐台登录主机,逐台使用环境配置脚本来配置,虽然可以完成任务,但是效率低下。为了提高效率,本文介绍如何在单节点通过脚本方式实现多台主机批量执行命令。
-
训练运行报错AttributeError: 'torch - AI开发平台ModelArts
训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' 问题现象 训练运行报错“AttributeError: 'torch_npu
-
昇腾迁移融合算子API替换样例 - AI开发平台ModelArts
昇腾迁移融合算子API替换样例 部分torch原生的API在下发和执行时会包括多个小算子,下发和执行耗时较长,可以通过替换成NPU API来使能融合算子,提升训练性能。 API替换总览 •torch_npu.optim.NpuFusedAdamW •optimizer.clip_grad_norm_fused_
-
GP Vnt1裸金属服务器EulerOS 2.9安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
了一组C函数,用于读取、修改和创建ELF文件,而NVIDIA驱动程序需要使用这些函数来解析当前正在运行的内核和其他相关信息。 安装过程中的提示均选OK或YES,安装好后执行reboot重启机器,再次登录后执行命令查看GPU卡信息。 nvidia-smi -pm 1 #该命
-
示例:从 0 到 1 制作自定义镜像并用于训练(MindSpore+Ascend) - AI开发平台ModelArts
示例:从 0 到 1 制作自定义镜像并用于训练(MindSpore+Ascend) 场景描述 Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中 Step3 制作自定义镜像 Step4 上传镜像至SWR Step5 在ModelArts上创建Notebook并调试
-
上传本地大文件(100MB~5GB)至JupyterLab - AI开发平台ModelArts
上传本地大文件(100MB~5GB)至JupyterLab 对于大小超过100MB不超过5GB的文件可以使用OBS中转,系统先将文件上传至OBS(对象桶或并行文件系统),然后从OBS下载到Notebook。下载完成后,ModelArts会将文件自动从OBS中删除。 例如,对于下面这种情况,可以通过“OBS中转”上传。
-
GP Vnt1裸金属服务器的Docker模式环境搭建 - AI开发平台ModelArts
io/libnvidia-container/$distribution/libnvidia-container.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
version=515.105.01 main_version=$(echo $version | awk -F '.' '{print $1}') apt-get update apt-get -y install nvidia-fabricmanager-${main_version}=${version}-*