搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理时，要执行的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
eagle投机小模型训练 - AI开发平台ModelArts

eagle投机小模型训练本章节提供eagle小模型自行训练的能力，客户可通过本章节，使用自己的数据进行训练eagle小模型，并使用自行训练的小模型进行eagle推理。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel）本章节介绍基于PyTorch引擎的多机多卡数据并行训练。并提供了分布式训练调测具体的代码适配操作过程和代码示例。同时还针对Resnet18在cifar10数据集上的分类任务，给出了分布式训练改造(DDP)的完整代码示例，供用户学习参考。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
LoRA微调训练 - AI开发平台ModelArts

用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。在“输入”的输入框内设置变量：ORIGINAL_TRAIN_DATA_PATH、ORIGINAL_HF_WEIGHT。 ORIGINAL_TRAIN_DATA_PATH：训练时指定的输入数据集路径。 ORIGI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练数据集预处理说明训练权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
创建模型训练工程 - 网络智能体

创建模型训练工程创建工程编辑训练代码（简易编辑器）编辑训练代码（WebIDE）模型训练 MindSpore样例父主题：模型训练

 帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 模型训练
训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，需要针对模型的tokenizer文件进行修改，不同模型的tokenizer文件修改内容如下，您可在创建的Notebook中对tokenizer文件进行编辑。 ChatGLMv3-6B 在训练开始前，针对ChatGLMv3-6B模型中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

Server适配PyTorch NPU的LoRA训练指导（6.3.905） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。SDXL LoRA训练是指在已经训练好的SDXL模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。在“输入”的输入框内设置变量：ORIGINAL_TRAIN_DATA_PATH、ORIGINAL_HF_WEIGHT。 ORIGINAL_TRAIN_DATA_PATH：训练时指定的输入数据集路径。 ORIGI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
如何在模型训练时，查看镜像中Python库的版本？ - 网络智能体

如何在模型训练时，查看镜像中Python库的版本？模型训练时，在训练的代码中增加如下所示的代码行，执行训练即可查看： print(os.system("pip list")) 如果是JupyterLab环境，则在cell中执行如下命令： !pip list 如果是WebIDE环

 帮助中心 > 网络智能体 > 模型训练服务 > 常见问题 > 模型训练
发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

发布训练后的科学计算大模型科学计算大模型训练完成后，需要执行发布操作，操作步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“模型开发 > 模型训练”，单击模型名称进入任务详情页。单击进入“训练结果”页签，单击“发布”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
模型验证 - 网络智能体
模型验证 - 网络智能体

模型验证模型验证界面已经预置了模型验证服务，本次不使用，仅供参考。下面会提供端到端的操作流程，帮助用户快速熟悉模型验证界面操作。单击菜单栏中的“模型验证”，进入模型验证界面。可以看到预置的模型验证任务“hardisk-detect”。单击“创建”，弹出如图1所示的对话框。

帮助中心 > 网络智能体 > 模型训练服务 > 快速入门 > 使用模型训练服务快速训练算法模型
LoRA微调训练 - AI开发平台ModelArts

断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
模型NPU卡数取值表 - AI开发平台ModelArts

模型NPU卡数取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推表1 模型NPU卡数取值表支持模型支持模型参数量文本序列长度训练类型 Zero并行规格与节点数 llama3 70B cutoff_len=4096

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建生产训练作业 - AI开发平台ModelArts

创建生产训练作业模型训练是一个不断迭代和优化模型权重的过程。ModelArts的训练模块支持创建训练作业、查看训练情况以及管理训练版本。通过模型训练试验模型结构、数据和超参的各种组合，便于找到最佳的模型结构和权重。创建生产环境的训练作业有2种方式：通过ModelArts S

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
创建Tensorboard - 网络智能体
创建Tensorboard - 网络智能体

创建Tensorboard方式：创建训练任务的时候同步创建Tensorboard 在模型训练工程代码编辑界面控制台的Tensorboard页签中创建Tensorboard 新建模型训练工程，创建训练任务后，在任务详情的Tensorboard页签中创建Tensorboard 配置训练任务时，AI引擎选择Py

帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 模型训练
SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

Server适配PyTorch NPU的Finetune训练指导（6.3.905） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。SDXL Finetune是指在已经训练好的SDXL模型基础上，使用新的数据集进行微调（fin

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
LoRA微调训练 - AI开发平台ModelArts

断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint继续训练。当训练作业发生

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
LoRA微调训练 - AI开发平台ModelArts

断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint继续训练。当训练作业发生

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
训练图像分类模型 - AI开发平台ModelArts

训练图像分类模型完成图片标注后，可进行模型的训练。模型训练的目的是得到满足需求的图像分类模型。请参考前提条件确保已标注的图片符合要求，否则数据集校验将会不通过。前提条件请确保您的数据集中的已标注的图片不低于100张。请确保您的数据集中至少存在2种以上的图片分类，且每种分类的图片不少于5张。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

eagle投机小模型训练 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

创建模型训练工程 - 网络智能体

训练tokenizer文件说明 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

如何在模型训练时，查看镜像中Python库的版本？ - 网络智能体

发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

模型验证 - 网络智能体

LoRA微调训练 - AI开发平台ModelArts

模型NPU卡数取值表 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

创建Tensorboard - 网络智能体

SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线