搜索_华为云

制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard 自定义镜像使用场景 ModelArts支持的预置镜像列表制作自定义镜像用于创建Notebook 制作自定义镜像用于训练模型制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
PyTorch迁移精度调优 - AI开发平台ModelArts

PyTorch迁移精度调优精度问题概述精度调优总体思路精度调优前准备工作 msprobe精度分析工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
msprobe工具使用指导 - AI开发平台ModelArts

msprobe工具使用指导 msprobe API预检 msprobe精度比对 msprobe梯度监控父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
执行训练任务 - AI开发平台ModelArts

执行训练任务执行训练任务（推荐）执行训练任务（历史版本）父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） mc2融合算子报错父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
PyTorch迁移性能调优 - AI开发平台ModelArts

PyTorch迁移性能调优性能调优总体原则和思路 MA-Advisor性能调优建议工具使用指导 MindStudio-Insight性能可视化工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
创建模型规范参考 - AI开发平台ModelArts

创建模型规范参考模型包结构介绍模型配置文件编写说明模型推理代码编写说明自定义引擎创建模型规范自定义脚本代码示例父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
查询Workflow待办事项 - AI开发平台ModelArts

8b8d018a", "step_name" : "condition_step", "step_title" : "skip training", "status" : "wait_inputs" }, { "time" : "2022-10-20T15:01:42

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Standard模型训练 - AI开发平台ModelArts

Standard模型训练，用户可以专注于开发、训练和微调模型。 ModelArts Standard模型训练支持大规模训练作业，提供高可用的训练环境支持单机多卡、多机多卡的分布式训练，有效加速训练过程支持训练作业的故障感知、故障诊断与故障恢复，包含硬件故障与作业卡死故障，并支持进程级恢复、容器级恢复

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

大模型分布式部署及推理。统一管理AI开发全流程，提升开发效率，记录模型构建实验全流程。多场景部署，灵活满足业务需求支持云端/边端部署等多种生产环境。支持在线推理、批量推理、边缘推理多形态部署。 AI工程化能力，支持AI全流程生命周期管理支持MLOps能力，提供数据诊断、

帮助中心 > AI开发平台ModelArts > 产品介绍
数据集版本发布失败 - AI开发平台ModelArts

出现此故障时，建议根据如下建议，修改标注数据后重试。多标签的样本（即一张图片包含多个标签），至少需要有2张。如果启动训练时，设置了数据集切分功能，如果多标签的数据少于2张，会导致数据集切分失败。建议检查您的标注信息，保证标注多标签的图片，超过2张。数据集切分后，训练集和验证集包

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
查询数据集的团队标注任务列表 - AI开发平台ModelArts

团队标注任务当前验收任务详情。 create_time Long 标注任务创建时间。 dataset_id String 数据集ID。 description String 标注任务描述信息。 label_stats Array of LabelStats objects 标注任务标签统计信息。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取APP列表 - AI开发平台ModelArts

否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 iphertext_enabled 否 Boolean 是否明文展示appsecret。 app_ids 否 Array of strings

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
订阅免费模型 - AI开发平台ModelArts

订阅免费模型在AI Gallery中，您可以查找并订阅免费的模型，包括ModelArts模型和HiLens技能。订阅成功的模型可以直接用于ModelArts模型部署和HiLens技能安装。 AI Gallery中分享的模型支持免费订阅，但在使用过程中如果消耗了硬件资源进行部署，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
Yaml配置文件参数配置说明 - AI开发平台ModelArts

采取lora策略方法的目标模块，默认为all dataset 指令监督微调/ppo：alpaca_en_demo rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

采取lora策略方法的目标模块，默认为all dataset 指令监督微调/ppo：alpaca_en_demo rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

采取lora策略方法的目标模块，默认为all dataset 指令监督微调/ppo：alpaca_en_demo rm/dpo:dpo_en_demo 多模态数据集(图像)：mllm_demo,identity 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

是，则修改安全组的配置，具体操作请参见修改安全组规则。否，则继续下一步。确认SFS Turbo是否存在异常。新建一个和SFS Turbo在同一个网段的ECS，用ECS去挂载SFS Turbo，如果挂载失败，则表示SFS Turbo异常。是，联系SFS服务的技术支持处理。否，联系ModelArts的技术支持处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
推理场景介绍 - AI开发平台ModelArts

at main (huggingface.co) 注意：Qwen2-VL 开源vllm依赖特定transformers版本，请手动安装： pip install git+https://github.com/huggingface/transformers.git@21fac7ab

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
Eagle投机小模型训练 - AI开发平台ModelArts

ma2系列和Qwen2系列模型。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理

总条数： 1677

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

PyTorch迁移精度调优 - AI开发平台ModelArts

msprobe工具使用指导 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

PyTorch迁移性能调优 - AI开发平台ModelArts

创建模型规范参考 - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

查询数据集的团队标注任务列表 - AI开发平台ModelArts

获取APP列表 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线