搜索_华为云

附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
新建训练作业 - 推荐系统 RES
新建训练作业 - 推荐系统 RES

离线排序作业名称（在线训练任务需要提供此参数）。 update_interval Integer 更新周期（在线训练任务需要提供此参数）。 optimizer Optimizer object 优化器（在线训练任务需要提供此参数）。 flows Flow object 在线流程（在线训练任务需要提供此参数）。

帮助中心 > 推荐系统 RES > API参考 > API > 训练作业
训练算法 - 自动驾驶云服务 Octopus

训练算法添加自定义算法添加自定义算法流程为“初始化训练算法 > 选择训练算法文件 > 上传训练算法文件”。具体操作步骤如下：在左侧菜单栏中单击“训练服务 > 算法管理”。单击“新建训练算法”，填写算法基本信息。图1 新建训练算法名称：包含中英文、数字、“_”“-”，不得超过64个字符。

帮助中心 > 自动驾驶云服务 Octopus > 快速入门 > 自动驾驶云服务全流程开发 > 训练服务
Finetune训练 - AI开发平台ModelArts

Finetune训练本章节介绍SDXL&SD 1.5模型的Finetune训练过程。Finetune是指在已经训练好的模型基础上，使用新的数据集进行微调（fine-tuning）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ ModelArts支持用户上传自定义算法创建训练作业。上传自定义算法前，请完成创建算法并上传至OBS桶。创建算法请参考开发用于预置框架训练的代码。创建训练作业请参考创建训练作业指导。解析输入路径参数、输出路径参数运行在Mo

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

算法代码存储的OBS路径。训练代码、依赖安装包或者预生成模型等训练所需文件上传至该代码目录下。请注意不要将训练数据放在代码目录路径下。训练数据比较大，训练代码目录在训练作业启动后会下载至后台，可能会有下载失败的风险。训练作业创建完成后，ModelArts会将代码目录及其子目录下载至训练后台容器中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
BF16和FP16说明 - AI开发平台ModelArts

从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF16因其

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

从而提供更好的稳定性和可靠性，在大模型训练和推理以及权重存储方面更受欢迎。 FP16：用于深度学习训练和推理过程中，可以加速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF16因其

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
停止训练作业版本 - AI开发平台ModelArts

停止训练作业版本功能介绍停止训练作业。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI POST /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/stop 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用模型训练服务快速训练算法模型 - 网络智能体

使用模型训练服务快速训练算法模型本文档以硬盘故障检测的模型训练为例，介绍模型训练服务使用的全流程，包括数据集、特征工程、模型训练、模型管理和模型验证，使开发者快速熟悉模型训练服务。操作流程前提条件订购模型训练服务访问模型训练服务创建项目数据集特征工程模型训练模型管理

 帮助中心 > 网络智能体 > 模型训练服务 > 快速入门
训练作业调测 - AI开发平台ModelArts

训练作业调测使用SDK调测单机训练作业使用SDK调测多机分布式训练作业父主题：训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练启动脚本说明和参数配置 - AI开发平台ModelArts

GBS 128 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

成训练模型。如果未生成model文件夹或者训练模型，可能是训练输入数据不完整导致，请检查训练数据上传是否完整，并重新训练。图4 训练输出路径 Step5 推理部署模型训练完成后，可以创建模型，将模型部署为在线服务。在ModelArts管理控制台，单击左侧导航栏中的“模型管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
模型管理 - 网络智能体
模型管理 - 网络智能体

模型管理单击菜单栏中的“模型管理”，可在“模型管理”界面查看打包好的模型，如图1所示。图1 模型管理父主题：使用模型训练服务快速训练算法模型

 帮助中心 > 网络智能体 > 模型训练服务 > 快速入门 > 使用模型训练服务快速训练算法模型
训练启动脚本说明和参数配置 - AI开发平台ModelArts

GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询训练作业日志 - AI开发平台ModelArts

查询训练作业日志功能介绍按行来查询训练作业日志详细信息。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/aom-log 参数说明如表1所示。表1 路径参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
保存横向联邦学习作业 - 可信智能计算服务 TICS

ague_id}/fl-jobs/{job_id} 保存横向联邦学习作业响应示例无状态码状态码描述 200 保存横向联邦学习作业成功 401 操作无权限 500 内部服务器错误父主题：可信联邦学习作业管理

 帮助中心 > 可信智能计算服务 TICS > API参考 > 计算节点API > 可信联邦学习作业管理
编辑训练代码（WebIDE） - 网络智能体

编辑训练代码（WebIDE）支持使用WebIDE开发环境编辑代码。可选择下述一种方式，进入WebIDE开发环境编辑代码：在“模型训练”菜单页面，“开发环境”为WebIDE环境的情况下，单击模型训练工程所在行的。在“模型训练”菜单页面，单击模型训练工程所在行，进入详情界面。

帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 模型训练 > 创建模型训练工程
如何获得微认证的学习材料？ - 华为云开发者学堂

如何获得微认证的学习材料？华为云开发者学堂提供在线的视频课程，对应课程的实验手册可以在微认证详情页面上获取。父主题：微认证课程学习常见问题

 帮助中心 > 华为云开发者学堂 > 用户指南 > 华为云微认证 > 微认证课程学习常见问题

总条数： 8366

上一页
1
...
7
8
9
...
419
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：指令微调训练常见问题 - AI开发平台ModelArts

新建训练作业 - 推荐系统 RES

训练算法 - 自动驾驶云服务 Octopus

Finetune训练 - AI开发平台ModelArts

在ModelArts上训练模型如何配置输入输出数据？ - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

使用模型训练服务快速训练算法模型 - 网络智能体

训练作业调测 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

模型管理 - 网络智能体

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询训练作业日志 - AI开发平台ModelArts

保存横向联邦学习作业 - 可信智能计算服务 TICS

编辑训练代码（WebIDE） - 网络智能体

如何获得微认证的学习材料？ - 华为云开发者学堂

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线