-
开发环境计费项 - AI开发平台ModelArts
专属资源池的费用请参考专属资源池计费项。 - - 存储资源 云硬盘EVS 用于存储运行Notebook实例时产生的数据。 磁盘规格默认为5GB,从Notebook实例创建成功起,直至删除成功,每GB按照规定费用收费。 具体费用可参见云硬盘价格详情。 注意: 存储到EVS中的数据需在EVS控制台进行手动删除。如果未
-
管理Notebook实例 - AI开发平台ModelArts
查找/启动/停止/删除实例 变更Notebook实例镜像 变更Notebook实例运行规格 开发环境中如何选择存储 动态挂载OBS并行文件系统 动态扩充云硬盘EVS容量 修改Notebook SSH远程连接配置 查看所有子账号的Notebook实例 查看Notebook实例事件 Notebook cache盘告警上报
-
故障恢复 - AI开发平台ModelArts
针对用户创建的Notebook计算实例,后台计算节点故障后会立即自动迁移到其他可用节点上,实例状态会自动恢复。针对数据存储部分,提供了云硬盘存储挂载方式,华为云云硬盘提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务,数据持久性高达99.9999999%。 训练故障自动恢复 用户在训练模型过程中,存在因硬件故障
-
DevServer资源使用 - AI开发平台ModelArts
DevServer资源使用 GP Ant8裸金属服务器使用Megatron-Deepspeed训练GPT2并推理 查看CPU 弹性裸金属切换操作系统 GP Ant8裸金属本地磁盘合并挂载至指定目录并设置开机启动自动挂载 GP Vnt1裸金属本地磁盘合并挂载至指定目录并设置开机启动自动挂载
-
NPU Snt9B集合通信算子多机多卡性能测试指导 - AI开发平台ModelArts
NPU Snt9B集合通信算子多机多卡性能测试指导 场景描述 本文介绍如何使用在2台NPU Snt9B服务器上进行集合通信算子多机性能测试,包括的集合通信算子:allreduce、reducescatter、allgather、all2all。 本文选择的服务器镜像是:EulerOS-2
-
如果不再使用ModelArts,如何停止收费? - AI开发平台ModelArts
如果有,单击Notebook列表右方操作下的“停止”即可停止Notebook计费。检查是否有带云硬盘EVS存储的Notebook。如果有,停止并删除该Notebook,即可停止EVS计费。 进入“ModelArts>训练管理>训练作业”页面,检查是否有“运行中”的训练作业。如果
-
如何查看ModelArts中正在收费的作业? - AI开发平台ModelArts
除了ModelArts总览页呈现的计费项之外,如果用户使用了OBS、云硬盘EVS存储,也会扣费。 请前往OBS控制台,及时清空OBS中的数据。 请在ModelArts控制台上,删除带有EVS存储的Notebook实例。前往EVS控制台,及时清空EVS中的数据。 父主题: 计费相关
-
资源购买 - AI开发平台ModelArts
使用Notebook代码调试时,需要创建Notebook实例,如果创建时选择“云硬盘EVS”作为存储位置,会创建云硬盘EVS。 磁盘规格默认5GB,从Notebook实例创建成功开始,直至实例删除成功,磁盘每GB按照规定费用收费。 云硬盘EVS会在创建Notebook实例时自动购买,无需用户单独创建。
-
创建Notebook实例 - AI开发平台ModelArts
并行文件系统,方便读取数据,具体操作参见动态挂载OBS并行文件系统。 如果存储使用的是云硬盘EVS,单击存储容量右侧的“扩容”,可以动态扩充云硬盘EVS的容量,具体操作参见动态扩充云硬盘EVS容量。 父主题: 管理Notebook实例
-
与其他服务的关系 - AI开发平台ModelArts
可以使用OBS存储数据、创建Notebook等操作。 与云硬盘的关系 ModelArts使用云硬盘服务(Elastic Volume Service,简称EVS)存储创建的Notebook实例。EVS的更多信息请参见《云硬盘用户指南》。 与云容器引擎的关系 ModelArts使用云容器引擎(Cloud
-
GPU A系列裸金属服务器RoCE性能带宽测试 - AI开发平台ModelArts
GPU A系列裸金属服务器RoCE性能带宽测试 场景描述 本文主要指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。 前提条件 GPU A系列裸金属服务器已经安装了IB驱动。(网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20
-
GPU A系列裸金属服务器节点内NVLINK带宽性能测试方法(Pytorch模式) - AI开发平台ModelArts
于理论值, 存在问题。 图3 异常模式带宽性能 出现这种现象, 可尝试重装nvidia/cuda/nvidia-fabricmanager, 重装后再测试又恢复到了正式模式,GPU0和GPU4之间带宽恢复到370GB/s。 可能原因如下,仅供参考: 驱动程序问题:可能是由于驱动程
-
DevServer资源开通 - AI开发平台ModelArts
DevServer资源开通 开通流程 准备工作 购买Server资源 镜像介绍 手动续费/自动续费包周期 父主题: 弹性裸金属DevServer
-
释放DevServer资源 - AI开发平台ModelArts
释放DevServer资源 退订包年/包月的DevServer资源 删除按需计费的DevServer资源 父主题: 弹性裸金属DevServer
-
GPU裸金属服务器环境配置 - AI开发平台ModelArts
04安装NVIDIA 470+CUDA 11.3 GPU A系列裸金属服务器更换NVIDIA和CUDA GPU A系列裸金属服务器RoCE性能带宽测试 NVIDIA和CUDA驱动安装指南 父主题: 环境配置
-
为什么项目删除完了,仍然还在计费? - AI开发平台ModelArts
制台,清理您不再使用的数据、文件夹以及OBS桶,避免产生不必要的费用。 您在创建Notebook时,选择了云硬盘EVS存储,该存储会单独收费,Notebook停止后,EVS还在计费,请及时删除该Notebook实例。 您在体验CodeLab时,切换规格为付费的规格时会收费。请前往
-
DevServer资源配置 - AI开发平台ModelArts
DevServer资源配置 使用前须知 配置流程 网络访问 存储 环境配置 监控 父主题: 弹性裸金属DevServer
-
附录:大模型推理常见问题 - AI开发平台ModelArts
附录:大模型推理常见问题 问题1:在推理预测过程中遇到NPU out of memory 解决方法:调整推理服务启动时的显存利用率,将--gpu-memory-utilization的值调小。 问题2:在推理预测过程中遇到ValueError:User-specified max_model_len
-
Notebook中的EVS存储可以使用套餐包吗? - AI开发平台ModelArts
Notebook中的EVS存储可以使用套餐包吗? 无法使用套餐包。 父主题: 计费相关
-
监控 - AI开发平台ModelArts
监控 CES服务监控方案 DCGM监控方案 父主题: DevServer资源配置