-
昇腾业务迁移 - AI开发平台ModelArts
昇腾业务迁移 LLM训练业务昇腾迁移指导 训练业务昇腾迁移通用指导 AIGC推理业务昇腾迁移指导 推理业务昇腾迁移通用指导
-
GP Ant8裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Ant8裸金属服务器支持的镜像详情 镜像1:Ubuntu20.04 With Nvidia Driver 525 镜像名称:Ubuntu 20.04 x86 64bit SDI3 for Ant8 BareMetal with RoCE and NVIDIA-525 CUDA-12
-
GPU A系列裸金属服务器无法获取显卡问题解决方法 - AI开发平台ModelArts
GPU A系列裸金属服务器无法获取显卡问题解决方法 问题现象 在A系列裸金属服务器上使用PyTorch一段时间后,出现获取显卡失败的现象,报错如下: > torch.cuda.is_available() /usr/local/lib/python3.8/dist-package
-
物理机环境配置 - AI开发平台ModelArts
run”,驱动包名称为“Ascend-hdk-型号-npu-driver_版本号_linux-aarch64.run”,商用版是权限受控,仅华为工程师和渠道用户有权限下载,下载地址请见固件驱动包下载链接 arch cat /etc/os-release 图5 查看机器操作系统版本及架构
-
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts
tworkManager服务,重新尝试SSH连接,验证网络是否恢复。 # 卸载 NetworkManagre-config-server rpm -e NetworkManager-config-server # 重启 NetworkManager 服务 systemctl restart
-
DevServer资源使用 - AI开发平台ModelArts
关闭和开启RoCE网卡网口 NPU Snt9B裸金属服务器算力查询 NPU Snt9B裸金属服务器docker网络配置方案 NPU Snt9B裸金属服务器多机批量执行命令 NPU Snt9B裸金属服务器安装深度学习框架PyTorch 启动/停止实例 同步裸金属服务器状态 父主题: 弹性裸金属DevServer
-
GP Vnt1裸金属服务器支持的镜像详情 - AI开发平台ModelArts
GP Vnt1裸金属服务器支持的镜像详情 GP Vnt1规格在北京四、北京一和上海一虽然规格相同,但是产品的配置、发布时间都存在很大差异,因此镜像不能共用。 镜像1:Ubuntu18.04 纯净版(仅限于北京四) 镜像名称:Ubuntu-18.04-server-64bit-for-Vnt1-BareMetal
-
NPU Snt9裸金属服务器支持的镜像详情 - AI开发平台ModelArts
NPU Snt9裸金属服务器支持的镜像详情 镜像:EulerOS纯净版 镜像名称:ModelArts-Euler2.8_Aarch64_Snt9_C78 表1 镜像详情 软件类型 版本详情 操作系统 EulerOS 2.0 (SP8) 内核版本 4.19.36-vhulk1907
-
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts
使用Gallery CLI配置工具下载文件 在服务器(ModelArts Lite云服务器或者是本地Windows/Linux等服务器)上登录Gallery CLI配置工具后,通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。 命令说明 登录Gallery
-
服务部署 - AI开发平台ModelArts
服务部署 自定义镜像模型部署为在线服务时出现异常 部署的在线服务状态为告警 服务启动失败 服务部署、启动、升级和修改时,拉取镜像失败如何处理? 服务部署、启动、升级和修改时,镜像不断重启如何处理? 服务部署、启动、升级和修改时,容器健康检查失败如何处理? 服务部署、启动、升级和修改时,资源不足如何处理?
-
配额说明 - AI开发平台ModelArts
配额说明 本服务应用的基础设施如下: 弹性云服务器 云硬盘 虚拟私有云 云容器引擎 其配额查看及修改请参见关于配额。
-
GPU A系列裸金属服务器RoCE带宽不足问题解决方法 - AI开发平台ModelArts
GPU A系列裸金属服务器RoCE带宽不足问题解决方法 问题现象 GP Ant8支持RoCE网卡, Ubuntu20.04场景,在进行nccl-tests时,总线带宽理论峰值可达90GB/s,但实际测试下来的结果只有35GB/s。 原因分析 “nv_peer_mem”是一个Lin
-
NPU Snt9B裸金属服务器安装深度学习框架PyTorch - AI开发平台ModelArts
NPU Snt9B裸金属服务器安装深度学习框架PyTorch 场景描述 昇腾为使用PyTorch框架的开发者提供昇腾AI处理器的超强算力,需要安装PyTorch Adapter插件用于适配PyTorch,本文介绍如何安装Pytorch框架和Pytorch Adapter插件。 本文使用ModelArts上的NPU
-
VS Code中设置远端默认安装的插件 - AI开发平台ModelArts
VS Code中设置远端默认安装的插件 在VS Code的配置文件settings.json中添加remote.SSH.defaultExtensions参数,如自动安装Python和Maven插件,可配置如下。 "remote.SSH.defaultExtensions": [
-
配置流程 - AI开发平台ModelArts
必选。(二选一) 单EIP绑定裸金属服务器 指导单EIP如何绑定在一台裸金属服务器上实现公网访问和SSH登录。 裸金属服务器支持IPV6解决方案 指导配置裸金属服务器实现支持IPV6。 可选。 2 存储 裸金属服务器存储指南 指导如何选择和使用存储服务。 必选。 3 环境配置 环境配置
-
Step1 准备Docker机器并配置环境信息 - AI开发平台ModelArts
议申请一台弹性云服务器并购买弹性公网IP,并在准备好的机器上安装必要的软件。 ModelArts提供了ubuntu系统的脚本,方便安装docker。 本地Linux机器的操作等同ECS服务器上的操作,请参考本案例。 创建ECS服务器 登录ECS控制台,购买弹性云服务器,镜像选择公共镜像,推荐使用ubuntu18
-
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts
获取待上传的文件名 获取待上传的文件在服务器的绝对路径。 上传单个文件 在服务器执行如下命令,可以将服务器上的文件上传到AI Gallery仓库里面。 gallery-cli upload {repo_id} {文件名} 如下所示,表示将服务器上的文件“D:\workplace\m
-
ModelArts SDK下载文件目标路径设置为文件名,部署服务时报错 - AI开发平台ModelArts
ModelArts SDK下载文件目标路径设置为文件名,部署服务时报错 问题现象 ModelArts SDK在OBS下载文件时,目标路径设置为文件名,在本地IDE运行不报错,部署为在线服务时报错。 代码如下: session.obs.download_file(obs_path,
-
场景描述 - AI开发平台ModelArts
场景描述 本文旨在指导如何在Snt9b裸金属服务器上,进行磁盘合并挂载、安装docker等环境配置。在配置前请注意如下事项: 首次装机时需要配置存储、固件、驱动、网络访问等基础内容,这部分配置尽量稳定减少变化。 裸机上的开发形式建议开发者启动独立的Docker容器作为个人开发环境
-
弹性裸金属切换操作系统 - AI开发平台ModelArts
弹性裸金属切换操作系统 场景描述 本文介绍弹性裸金属服务器如何完成操作系统切换。 操作步骤 获取操作系统镜像。 由华为云官方提供给客户操作系统镜像,在IMS镜像服务的共享镜像处进行接收即可,参考如下图操作。 图1 共享镜像 切换操作系统。 对裸金属服务器进行关机操作,完成关机后,才可以执行切换操作系统动作。