搜索_华为云

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

代码中涉及到的OBS路径，请用户替换为自己的实际OBS路径。代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，仅需修改7和11中的 framework_type参数值即可，例如：MindSpore框架，此处framework_type=Ascend-Powered-Engine。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
创建Notebook实例 - AI开发平台ModelArts

的算法训练和调测 Ascend规格有Snt9(32GB显存)单卡、两卡、八卡等规格。配搭ARM处理器，适合深度学习场景下的模型训练和调测。 “存储配置” 包括“云硬盘EVS”、“弹性文件服务SFS”、“对象存储服务OBS”和“并行文件系统PFS”。请根据界面实际情况和需要选择。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

日志文件，则对应的父级目录也不会上传。因此，PyTorch NPU的plog日志是按worker存储的，而不是按rank id存储的（这是区别于MindSpore的）。目前，PyTorch NPU并不依赖rank table file。 #!/bin/bash # MA preset

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

CANN 8.0.RC3 MindSpore Lite 2.3.0 OS arm ultralytics 8.2.70 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.909-xxx.zip软件包中的AscendCloud-CV-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
执行训练任务 - AI开发平台ModelArts

是，配置以下参数 packing: true 否，默认使用动态句长，注释掉packing参数。选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
执行训练任务 - AI开发平台ModelArts

是，配置以下参数 packing: true 否，默认使用动态句长，注释掉packing参数。选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
执行训练任务 - AI开发平台ModelArts

是，配置以下参数 packing: true 否，默认使用动态句长，注释掉packing参数。选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
demo.sh方式启动（历史版本） - AI开发平台ModelArts

是，配置以下参数 packing: true 否，默认使用动态句长，注释掉packing参数。选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
查看训练作业日志 - AI开发平台ModelArts

开启永久保存日志开关实时日志和历史日志都是标准日志输出，内容上没有区别。Ascend训练场景下，永久日志中会包含Ascend日志，这部分日志内容在ModelArts界面上看不到。普通日志说明普通日志中包含训练进程日志、pip-requirement.txt安装日志和ModelArts Standard平台日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

建算法”页面。填写算法的基本信息，包含“名称”和“描述”。设置算法启动方式，有以下三种方式可以选择。设置算法启动方式（预置框架）图1 使用预置框架创建算法需根据实际算法代码情况设置“代码目录”和“启动文件”。选择的预置框架和编写算法代码时选择的框架必须一致。例如编写算法代

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

py”，请参见训练mindspore-verification.py文件。 Ascend-Powered-Engine框架单机启动命令和分布式启动命令无区别。 Ascend-Powered-Engine框架支持多种启动方式来启动“启动文件”，默认是基于“RANK_TABLE_FILE”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
创建Workflow模型注册节点 - AI开发平台ModelArts

steps=[model_registration] ) 使用订阅模型+OBS的方式注册模型该方式本质上与自定义镜像+OBS的方式没有区别，只是自定义镜像变成从订阅模型中获取。具体使用案例： import modelarts.workflow as wf # 定义订阅的模型对象

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点

总条数： 72

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线