搜索_华为云

Lite Cluster资源开通 - AI开发平台ModelArts

1”命令延迟1分钟重启。存储配置开启存储配置开关，支持以下设置：系统盘：显示系统盘的磁盘类型和大小。系统盘的磁盘类型支持本地盘和云硬盘（包括通用SSO、高IO和超高IO）。部分规格的系统盘仅支持本地盘。容器盘：显示容器盘的存储类型、大小和数量。部分规格的容器盘存储类型支持手动设置，可以选择本地盘或云硬盘。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
Lite Cluster资源配置流程 - AI开发平台ModelArts

3 配置Lite Cluster存储如果没有挂载任何外部存储，此时可用存储空间根据dockerBaseSize的配置来决定，可访问的存储空间比较小，因此建议通过挂载外部存储空间解决存储空间受限问题。容器中挂载存储有多种方式，不同的场景下推荐的存储方式不一样，您可根据业务实际情进行选择。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

数相同。 node_rank：任务rank，用于多任务分布式训练。 master_addr：主任务（rank 0）的地址，设置为任务worker-0的通信域名。 master_port：在主任务（rank 0）上，用于分布式训练期间通信的端口。默认设置为18888端口。当遇到ma

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
获取训练作业支持的公共规格 - AI开发平台ModelArts

FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
ECS中构建新镜像（可选） - AI开发平台ModelArts

com/ma-group/pytorch_2_3_ascend:20240606 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。图2 训练作业启动命令父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

”。输入约束开启后，用户可以根据实际情况限制数据输入来源。输入来源可以选择“数据存储位置”或者“ModelArts数据集”。如果用户选择数据来源为ModelArts数据集，还可以约束以下三种：标注类型。数据类型请参考标注数据。数据格式。可选“Default”和“Carb

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在推理生产环境中部署推理服务 - AI开发平台ModelArts

设置AI应用的详细参数解释请参见从OBS中选择元模型。根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图2 设置AI应用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
查询训练作业详情 - AI开发平台ModelArts

object 训练作业状态信息。创建作业无需填写。 algorithm JobAlgorithmResponse object 训练作业算法。目前支持三种形式： id：只取算法的id； subscription_id+item_version_id：取算法的订阅id和版本id； code_d

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
终止训练作业 - AI开发平台ModelArts

object 训练作业状态信息。创建作业无需填写。 algorithm JobAlgorithmResponse object 训练作业算法。目前支持三种形式： id：只取算法的id； subscription_id+item_version_id：取算法的订阅id和版本id； code_d

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
管理AI Gallery模型 - AI开发平台ModelArts

设置能够运行该模型的最低计算规格。在AI Gallery工具链服务中使用该模型时，只能选取等同或高于该规格的算力资源进行任务下发。是否支持分布式训练/推理选择该模型资产是否支持在单机多卡的资源节点上进行并行训练或推理。 README.md - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
推理业务迁移评估表 - AI开发平台ModelArts

的业务功能说明和并发机制。 - 是否有Linux内核驱动是否有业务相关的Linux内核驱动代码。 - 依赖第三方组件列表当前业务依赖的第三方软件列表（自行编译的第三方软件列表）。例如：Faiss等。 - 推理框架 TensorRT/Triton/MSLite等。例如： 2

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
模型训练使用流程 - AI开发平台ModelArts

参见以PyTorch框架创建训练作业。训练作业进阶功能 ModelArts Standard还支持以下训练进阶功能，例如：增量训练分布式训练训练加速训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查询训练作业列表 - AI开发平台ModelArts

object 训练作业状态信息。创建作业无需填写。 algorithm JobAlgorithmResponse object 训练作业算法。目前支持三种形式： id：只取算法的id； subscription_id+item_version_id：取算法的订阅id和版本id； code_d

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练迁移快速入门案例 - AI开发平台ModelArts

基于PyTorch上的第三方开发库非常多，例如transformers、accelerate、deepspeed以及Megatron-LM等，这些三方库昇腾也做了类似PyTorch Adapter的适配插件库。您可以在Gitee的昇腾官方仓库按需使用插件库。部分三方库例如最新版本de

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
最新动态 - AI开发平台ModelArts
最新动态 - AI开发平台ModelArts

最新动态本文介绍了ModelArts各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2023年8月序号功能名称功能描述阶段相关文档 1 Notebook连接大数据服务特性介绍如何将ModelArts Notebook开发

 帮助中心 > AI开发平台ModelArts > 最新动态
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

的业务功能说明和并发机制。 - 是否有Linux内核驱动是否有业务相关的Linux内核驱动代码。 - 依赖第三方组件列表当前业务依赖的第三方软件列表（自行编译的第三方软件列表）。例如：Faiss等。 - 推理框架 TensorRT/Triton/MSLite等。例如： 2

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
存储相关 - AI开发平台ModelArts
存储相关 - AI开发平台ModelArts

存储相关在ModelArts中如何查看OBS目录下的所有文件？

帮助中心 > AI开发平台ModelArts > 常见问题
在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ ModelArts管理控制台，提供了数据可视化能力，您可以在控制台查看详细数据以及标注信息。如需了解标注结果的存储路径，请参见如下说明。背景说明针对ModelArts中的数据集，在创建数据集时，需指定“数据集输入位置

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
创建Notebook实例 - AI开发平台ModelArts

Notebook，可以保留数据。 “扩展存储配置” 说明： “扩展存储配置”功能是白名单功能，如果有试用需求，请提工单申请权限。如果有多个数据存储路径，可以单击“增加扩展存储配置”，增加用户指定的存储挂载目录。支持增加的存储类型有“存储桶OBS”、“并行文件系统PFS”、“弹性文件服务SFS”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试

总条数： 703

上一页
1
...
5
6
7
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源开通 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

ECS中构建新镜像（可选） - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

最新动态 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

存储相关 - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线