搜索_华为云

执行训练任务 - AI开发平台ModelArts

Timeout”时请参考问题4：Error waiting on exit barrier错误 4、需要开启profiling功能进行性能数据采集和解析请参考录制Profiling 5、训练过程中报"ModuleNotFoundError: No module named 'tyro'"可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
执行训练任务 - AI开发平台ModelArts

Timeout”时请参考问题4：Error waiting on exit barrier错误 4、需要开启profiling功能进行性能数据采集和解析请参考录制Profiling 5、训练过程中报"ModuleNotFoundError: No module named 'multipa

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
推理服务测试 - AI开发平台ModelArts

t.json" 同时也可以为“dict”类型的变量，如： data = { "is_training": "False", "observations": [[1,2,3,4]], "default_policy/eps:0" : "0.0" } path 否 String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

息写入对应的Manifest文件中。数据集版本文件目录结构由于数据集是基于OBS目录管理的，发布为新版本后，对应的数据集输出位置，也将基于新版本生成目录。以图像分类为例，数据集发布后，对应OBS路径下生成，其相关文件的目录如下所示。 |-- user-specified-output-path

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
查询样本列表 - AI开发平台ModelArts

是否支持预览。可选值如下： true：支持预览 false：不支持预览 process_parameter 否 String 图像缩略设置，同OBS缩略图设置，详见OBS缩略图设置。如：image/resize,m_lfit,h_200表示等比缩放目标缩略图并设置高度为200像素。 sample_state

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
执行训练任务 - AI开发平台ModelArts

Timeout”时请参考问题4：Error waiting on exit barrier错误需要开启profiling功能进行性能数据采集和解析请参考录制Profiling 训练过程中报"ModuleNotFoundError: No module named 'tyro'"可参考

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
训练作业失败，返回错误码139 - AI开发平台ModelArts

reeturn code: 139 INFO:root:Using MoXing-v1.17.2-c806a92f INFO;root:Using OBS-Python-SDK-3.1.2 原因分析出现该问题的可能原因如下 pip源中的pip包更新了，之前能跑通的代码，在包更新之后产生了不

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912）本文档主要介绍如何在ModelArts的Lite Server环境中，使用NPU卡对CogVideoX模型进行全量微调。本文档中提供的脚本，是基于原生CogVid

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行的，需要购买并开通ModelArts专属资源池和OBS桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendSpeed训练代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查询AI应用详情 - AI开发平台ModelArts

模型版本。 source_job_version String 来源训练作业的版本。 source_location String 模型所在的OBS路径或SWR镜像的模板地址。 source_job_id String 来源训练作业的ID。 source_copy String 镜像复

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

“log_dir”参数建议设置为一个新的目录，“checkpoint_path”参数设置为上一次训练结果输出路径，如果是OBS目录，路径填写时建议使用“obs://”开头。如果标注数据中的标签发生了变化，在运行“mox.run”前先执行如果标签发生变化的操作。 mox.run(input_fn=input_fn

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
demo.sh方式启动（历史版本） - AI开发平台ModelArts

Timeout”时请参考问题4：Error waiting on exit barrier错误 4、需要开启profiling功能进行性能数据采集和解析请参考录制Profiling 5、训练过程中报"ModuleNotFoundError: No module named 'tyro'"可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

常见问题模型文件目录下不能出现dockerfile文件； “查看构建日志”中显示“Not only a Dockerfile in your OBS path, please make sure, The dockerfile list”，表示dockerfile文件目录有问题，模型文

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
数据准备使用流程 - AI开发平台ModelArts

解决用户获取数据的问题。用户可在AI Gallery上一键下载需要的数据资源到ModelArts数据集。提供多种数据接入方式，支持用户从OBS，MRS，DLI以及DWS等服务导入用户的数据。提供18+数据增强算子，帮助用户扩增数据，增加训练用的数据量。帮助用户提高数据的质量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
昇腾能力应用地图 - AI开发平台ModelArts

主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导 Llama3 Llama3-8b Llama3-70b

帮助中心 > AI开发平台ModelArts > 最佳实践
模型训练使用流程 - AI开发平台ModelArts

训练数据除了训练数据集，也可以是预测模型。在创建训练作业前，需要先准备好训练数据。当训练数据可以直接使用，无需二次处理时，可以直接将数据上传至OBS桶。在创建训练作业时，训练的输入参数位置可以直接填写OBS桶路径。当训练数据集的数据未标注或者需要进一步的数据预处理，可以先将数据导入ModelArts数据管理模块

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查看批量服务的事件 - AI开发平台ModelArts

Failed to update service, rollback failed. 请联系技术支持。正常 [model 0.0.1] OBS桶，OBS并行文件系统，SFS Turbo挂载成功。 [%s] %s volume successfully. - 服务部署和运行过程中，关键事件支持手动/自动刷新。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业

总条数： 1533

上一页
1
...
72
73
74
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线