-
申请购买专属昇腾AI云服务器 - AI开发平台ModelArts
图1 云服务器详情页 单击“前往集群控制台”跳转至CCE集群的总览页面,可以查看集群详情。 在节点页签,单击选择“前往控制台”跳转到云服务器控制台,支持查看节点的云服务基本信息或进行远程登录等操作。
-
同步裸金属服务器状态 - AI开发平台ModelArts
同步裸金属服务器状态 当用户在云服务器页面修改了裸金属服务器状态后,可同步其状态至ModelArts的弹性裸金属实例。 登录ModelArts管理控制台。 在左侧导航栏中,选择“专属资源池 > 弹性裸金属”,进入“弹性裸金属”列表页面。
-
在Linux上安装配置Grafana - AI开发平台ModelArts
购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。
-
Step1 准备Docker机器并配置环境信息 - AI开发平台ModelArts
本地Linux机器的操作等同ECS服务器上的操作,请参考本案例。 创建ECS服务器 登录ECS控制台,购买弹性云服务器,镜像选择公共镜像,推荐使用ubuntu18.04的镜像;系统盘设置为100GiB。具体操作请参考购买并登录弹性云服务器。
-
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts
通过“--include”从AI Gallery仓库依次下载包含某种格式的文件到云服务器的缓存目录下。
-
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts
使用Gallery CLI配置工具上传文件 在服务器(ModelArts Lite云服务器或者是本地Windows/Linux等服务器)上登录Gallery CLI配置工具后,通过命令“gallery-cli upload”可以往AI Gallery仓库上传资产。
-
配额说明 - AI开发平台ModelArts
配额说明 本服务应用的基础设施如下: 弹性云服务器 云硬盘 虚拟私有云 云容器引擎 其配额查看及修改请参见关于配额。
-
部署为在线服务 - AI开发平台ModelArts
部署为在线服务 AI应用准备完成后,您可以将AI应用部署为在线服务,对在线服务进行预测和调用。 约束与限制 单个用户最多可创建20个在线服务。 前提条件 数据已完成准备:已在ModelArts中创建状态“正常”可用的AI应用。 由于在线运行需消耗资源,确保账户未欠费。
-
GPU裸金属服务器无法Ping通的解决方案 - AI开发平台ModelArts
Oracle 1521 Oracle通信端口,弹性云服务器上部署了Oracle SQL需要放行的端口。 MySQL 3306 MySQL数据库对外提供服务的端口。
-
部署AI应用(在线服务) - AI开发平台ModelArts
部署AI应用(在线服务) 部署为在线服务 查看服务详情 测试服务 访问在线服务 集成在线服务 CloudShell 父主题: 部署AI应用(部署上线)
-
不同机型的对应的软件配套版本 - AI开发平台ModelArts
弹性云服务器的对应的软件配套版本 表2 弹性云服务器 类型 卡类型 操作系统 适用范围 依赖插件 NPU ascend-snt3p-300i 操作系统:EulerOS 2.9 架构类型:x86 集群类型:CCE Standard、CCE Turbo 集群版本:v1.23|v1.25
-
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts
ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像需要用Ubuntu 18.04的。 ECS服务器和SFS Turbo需要在同一子网中。 操作步骤 在ECS服务器中设置华为云镜像源。 sudo sed -i "s@http://.
-
配置外网访问(EIP) - AI开发平台ModelArts
配置外网访问(EIP) 弹性公网IP(Elastic IP,简称EIP)提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑。
-
GPU A系列裸金属服务器RoCE性能带宽测试 - AI开发平台ModelArts
ib_write_bw -a -F 服务器A的IP -d mlx5_0 --report_gbits 图1 服务器A执行结果 图2 服务器B执行结果 父主题: GPU裸金属服务器环境配置
-
GPU A系列裸金属服务器更换NVIDIA和CUDA - AI开发平台ModelArts
具体操作请参考GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML。 若遇到加载到内核的nvidia进程循环依赖,无法从内核中卸载nvidia,此时执行reboot命令重启服务器即可。
-
Atlas800训练服务器硬件指南 - AI开发平台ModelArts
Atlas 800训练服务器三维视图 Atlas 800 训练服务器(型号9000)是基于华为鲲鹏920+Snt9处理器的AI训练服务器,实现完全自主可控,广泛应用于深度学习模型开发和AI训练服务场景,可单击此处查看硬件三维视图。
-
GP Vnt1裸金属服务器的Docker模式环境搭建 - AI开发平台ModelArts
GP Vnt1裸金属服务器的Docker模式环境搭建 场景描述 本文指导如何在Vnt1裸金属服务器上安装Docker环境(服务器系统需为Ubuntu18.04或Ubuntu20.04)。 操作步骤 NVIDIA驱动安装。
-
GP Vnt1裸金属服务器Ubuntu 18.04安装NVIDIA 470+CUDA 11.4 - AI开发平台ModelArts
import torch print(torch.cuda.is_available()) 父主题: GPU裸金属服务器环境配置
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0 - AI开发平台ModelArts
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 525+CUDA 12.0 场景描述 本文旨在指导完成GP Ant8裸金属服务器装机和nccl-test测试。
-
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7 - AI开发平台ModelArts
GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7 场景描述 本文旨在指导完成GP Ant8裸金属服务器装机和nccl-test测试。