搜索_华为云

更新训练作业描述 - AI开发平台ModelArts

{training_job_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业标签 - AI开发平台ModelArts

/v2/{project_id}/trainJob/{training_job_id}/tags/create 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
分布式训练功能介绍 - AI开发平台ModelArts

如果用户在AI Hub中打开了可用的案例，会自动跳转到CodeLab中，此时是可以使用这项功能的。如果切换了Notebook的规格，那么只能在Notebook进行单机调测，不能进行分布式调测，也不能提交远程训练作业。当前仅支持PyTorch和MindSpore AI框架，如果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
功能介绍 - AI开发平台ModelArts
功能介绍 - AI开发平台ModelArts

功能介绍 Standard功能介绍 MaaS大模型即服务平台功能介绍 Lite Cluster&Server介绍 AI Gallery功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍
各个模型训练前文件替换 - AI开发平台ModelArts

命令：进入到代码目录下{work_dir}/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/如： cd /home/ma-user/ws/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

命令：进入到代码目录下{work_dir}/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/如： cd /home/ma-user/ws/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

命令：进入到代码目录下{work_dir}/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/如： cd /home/ma-user/ws/llm_train/LLaMAFactory/ascendcloud_patch/models/falcon2/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
查询训练作业版本详情 - AI开发平台ModelArts

Integer 训练作业worker的个数。 data_url String 训练作业的数据集。 train_url String 训练作业输出文件OBS路径。 log_url String 训练作业的日志OBS输出路径URL，默认为空。如：“/usr/train/”。 dataset_version_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

华为针对AI场景推出的异构计算架构）计算库。提交训练作业后，ModelArts Standard平台会自动运行训练作业的启动文件。 Ascend-Powered-Engine框架的启动文件的默认启动方式如下：每个训练作业的启动文件的运行次数取决于任务卡数，即在训练作业运行时，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
训练作业进程被kill - AI开发平台ModelArts

训练作业进程被kill 问题现象用户进程被Kill表示用户进程因外部因素被Kill或者中断，表现为日志中断。原因分析 CPU软锁在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练作业运行失败 - AI开发平台ModelArts

训练作业运行失败训练作业运行失败排查指导训练作业运行失败，出现NCCL报错自定义镜像训练作业失败定位思路使用自定义镜像创建的训练作业一直处于运行中使用自定义镜像创建训练作业找不到启动文件训练作业的监控内存指标持续升高直至作业失败订阅算法物体检测YOLOv3_ResN

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
删除训练作业标签 - AI开发平台ModelArts

删除训练作业标签功能介绍删除训练作业标签，支持批量删除。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/train

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查看训练作业资源占用情况 - AI开发平台ModelArts

查看训练作业资源占用情况约束限制训练作业的资源占用情况系统会自动保存30天，过期会被清除。如何查看训练作业资源使用详情在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

场景介绍准备工作 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： MLLM多模态模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
自如何获取ModelArts训练容器中的文件实际路径？ - AI开发平台ModelArts

__) #获得文件所在的路径（绝对路径）也可在搜索引擎寻找其他获取文件路径的方式，使用获取到的路径进行文件读写。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理standard常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ Standard中训练作业如何收费？如果您使用的是公共资源池，则根据您选择的规格、节点数、运行时长进行计费。计费规则为“规格单价×节点数×运行时长”（运行时长精确到秒）。如果您使用的是专属资源池，则训练作业就不再进行单独计费。由专属资源池进行收费。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ

总条数： 2651

上一页
1
...
4
5
6
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新训练作业描述 - AI开发平台ModelArts

创建训练作业标签 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

功能介绍 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

训练作业运行失败 - AI开发平台ModelArts

删除训练作业标签 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

自如何获取ModelArts训练容器中的文件实际路径？ - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线