搜索_华为云

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。De

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
模型训练 - AI开发平台ModelArts
模型训练 - AI开发平台ModelArts

模型训练自动学习训练作业失败父主题：自动学习

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习
自动学习训练作业失败 - AI开发平台ModelArts

自动学习训练作业失败自动学习训练作业创建失败，一般是因为后台服务故障导致的，建议稍等片刻，然后重新创建训练作业。如果重试超过3次仍无法解决，请联系华为云技术支持。自动学习训练作业创建成功，但是在运行过程中，由于一些故障导致作业运行失败，排查方式如下：首次出现请检查您的账户是

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
训练管理 - AI开发平台ModelArts
训练管理 - AI开发平台ModelArts

训练管理训练作业资源和引擎规格接口

 帮助中心 > AI开发平台ModelArts > SDK参考
Standard模型训练 - AI开发平台ModelArts

力，保障用户训练作业的长稳运行提供训练作业断点续训与增量训练能力，即使训练因某些原因中断，也可以基于checkpoint接续训练，保障需要长时间训练的模型的稳定性和可靠性，避免重头训练耗费的时间与计算成本支持训练数据使用SFS Turbo文件系统进行数据挂载，训练作业产生的中间和结果等数据可以直接高速写入到SFS

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？在自动学习项目中，每训练一次，将自动产生一个训练版本。当前一次的训练结果不满意时（如对训练精度不满意），您可以适当增加高质量的数据，或者增减标签，然后再次进行训练。增量训练目前仅支持“图像分类”、“物体检测”、“声音分类”类型的自动学习项目。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

超过最大递归深度导致训练作业失败问题现象 ModelArts训练作业报错： RuntimeError: maximum recursion depth exceeded in __instancecheck__ 原因分析递归深度超过了Python默认的递归深度，导致训练失败。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
训练管理（旧版） - AI开发平台ModelArts

训练管理（旧版）训练作业训练作业参数配置可视化作业资源和引擎规格接口作业状态参考父主题：历史API

帮助中心 > AI开发平台ModelArts > API参考 > 历史API
查询训练作业的运行指标 - AI开发平台ModelArts

Object 会话对象，初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。表2 get_job_log请求参数说明参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
创建训练作业 - AI开发平台ModelArts

是 String 训练作业类型。默认使用job，表示训练作业。 visualization_job：表示可视化作业 metadata 是 JobMetadata object 训练作业元信息。 algorithm 否 JobAlgorithm object 训练作业算法。目前支持三种形式：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

训练作业创建训练作业查询训练作业列表查询训练作业版本详情删除训练作业版本查询训练作业版本列表创建训练作业版本停止训练作业版本更新训练作业描述删除训练作业获取训练作业日志的文件名查询预置算法查询训练作业日志父主题：训练管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
在ModelArts自动学习中模型训练图片异常怎么办？ - AI开发平台ModelArts

在ModelArts自动学习中模型训练图片异常怎么办？使用自动学习的图像分类或物体检测算法时，标注完成的数据在进行模型训练后，训练结果为图片异常。针对不同的异常情况说明及解决方案参见表1。表1 自动学习训练中图片异常情况说明（图像分类和物体检测）序号图片异常显示字段图片异常说明

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
训练预测分析模型 - AI开发平台ModelArts

同一个自动学习项目可以训练多次，每次训练会注册一个新的模型一个版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。评估结果说明根据训练数据类的不同评估结果会包含不同的指标。离散值评估结果包含

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
训练文本分类模型 - AI开发平台ModelArts

时说明模型效果较好。同一个自动学习项目可以训练多次，每次训练生成一个版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现文本分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
训练图像分类模型 - AI开发平台ModelArts

明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现图像分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
终止训练作业 - AI开发平台ModelArts

String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。表2 返回参数说明参数参数类型描述 kind String 训练作业类型。默认使用job。枚举值： job：训练作业 hetero_job：异构作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练物体检测模型 - AI开发平台ModelArts

模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型一个版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现物体检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
训练声音分类模型 - AI开发平台ModelArts

明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现声音分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
准备模型训练镜像 - AI开发平台ModelArts

准备模型训练镜像 ModelArts平台提供了Tensorflow，PyTorch，MindSpore等常用深度学习任务的基础镜像，镜像里已经安装好运行任务所需软件。当基础镜像里的软件无法满足您的程序运行需求时，您还可以基于这些基础镜像制作一个新的镜像并进行训练。训练作业的预置框架介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型

总条数： 2653

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

模型训练 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

训练管理 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

在ModelArts自动学习中，如何进行增量训练？ - AI开发平台ModelArts

超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

训练管理（旧版） - AI开发平台ModelArts

查询训练作业的运行指标 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

在ModelArts自动学习中模型训练图片异常怎么办？ - AI开发平台ModelArts

训练预测分析模型 - AI开发平台ModelArts

训练文本分类模型 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

准备模型训练镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线