搜索_华为云

训练脚本说明参考 - AI开发平台ModelArts

训练脚本说明参考训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明离线训练安装包准备说明父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
VS Code ToolKit连接Notebook - AI开发平台ModelArts

执行，可以在下方的Terminal中看到代码输出信息。如果执行较长时间的训练作业，建议使用nohup命令后台运行，否则SSH窗口关闭或者网络断连会影响正在运行的训练作业，命令参考： nohup your_train_job.sh > output.log 2>&1 & tail

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明录制Profiling 父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明录制Profiling 父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

ra是训练参数设置方式。为了更加明确的区分不同策略，以及和llama-factory对齐，6.3.912版本调整以下参数：新增 STAGE，表示训练的阶段，可以选择的参数包括: {pt, sft}. 新增 FINETUNING_TYPE，表示微调的策略，可以选择的参数包括：{full

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
配置Grafana数据源 - AI开发平台ModelArts

图5 配置Grafana数据源 Grafana安装方式不同，Grafana版本也可能不同，图5仅为示例，请以实际配置界面为准。表1 参数配置说明参数名称配置说明 Name 自定义名称。 URL 设置为从c.从“设置”页签的“Grafana数据源配置信...获取的HTTP URL信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
重试/停止/运行Workflow节点 - AI开发平台ModelArts

息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关数据的配置后，可单击“继续运行”按钮并确认继续执行当前节点。部分运行Workflow节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

ra是训练参数设置方式。为了更加明确的区分不同策略，以及和llama-factory对齐，6.3.912版本调整以下参数：新增 STAGE，表示训练的阶段，可以选择的参数包括: {pt, sft}. 新增 FINETUNING_TYPE，表示微调的策略，可以选择的参数包括：{full

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
订阅Workflow - AI开发平台ModelArts

费订阅，但在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储算法和Workflow。订阅免费Workflow 登录“AI Gallery”。选择“资产集市 > MLOps > Work

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
发布数据集到AI Gallery - AI开发平台ModelArts

数据集”下，选择未发布的数据集，单击数据集名称，进入数据集详情页。在数据集详情页，单击右侧“发布”，在发布数据集页面编辑发布信息后，单击“发布”。表1 发布数据集的参数说明参数名称说明中文名称数据集发布后显示的名称，在创建数据集时设置的名称，此处不可编辑。任务类型选择合适的任务类型。许可证必填项，根据业务需求选择合适的许可证类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
（可选）配置镜像预热 - AI开发平台ModelArts

池详情。单击左侧“配置管理”，进入资源池配置管理页面。图1 配置管理在镜像预热中单击编辑图标，填写镜像预热信息。表1 镜像预热参数参数名称说明镜像来源可选择“预置”或“自定义”的镜像。预置：可选择SWR服务上自有的或他人共享的镜像。自定义：可直接填写镜像地址。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
使用kv-cache-int8量化 - AI开发平台ModelArts

执行convert_checkpoint.py脚本进行权重转换生成量化系数。使用tensorRT量化工具进行模型量化。在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
附录：指令微调训练常见问题 - AI开发平台ModelArts

denied 由于在容器中没有相应目录的权限，会导致访问时提示Permission denied。可以在宿主机中对相关目录做权限放开，执行命令如下。 chmod 777 -R ${dir} 问题3：训练过程报错：ImportError: This modeling file requires

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

LoRA微调LoRA(Low-Rank Adaptation)：微调是一种用于调整大型预训练模型的高效微调技术。这种方法主要针对如何在保持模型大部分参数固定的同时，通过引入少量可训练参数来调整模型以适应特定任务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
查询数据集详情 - AI开发平台ModelArts

dataset_info = dataset.get_dataset_info() print(dataset_info) # 输出数据集的详细信息参数说明无。父主题：数据集管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
查看Workflow工作流运行记录 - AI开发平台ModelArts

筛选：该功能支持您对所有运行记录按照“运行状态”和“运行标签”进行筛选。图2 筛选对比：针对某条工作流的所有运行记录，按照状态、运行记录、启动时间、运行时长、参数等进行对比。图3 对比当单击“启动”运行工作流时，运行记录列表会自动刷新，并更新至最新一条的执行记录数据，且与DAG图和总览数据面板双

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

LLamaFactory PyTorch NPU训练指导 LLM开源大模型基于Standard+OBS适配PyTorch NPU训练指导 LLM开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导 LLM开源大模型基于Lite Cluster适配PyTorch

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
查询导入任务列表 - AI开发平台ModelArts

list_tasks_resp = dataset.list_import_tasks() print(list_tasks_resp) # 打印导入任务列表参数说明无。父主题：导入任务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 导入任务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查看Lite Server服务器详情 - AI开发平台ModelArts

图1 查看Server节点单击某个Server节点名称，进入到Server节点详情页，可以查看更多信息，如表1所示。表1 详情页参数说明参数名称说明名称 Lite Server服务器的名称。实例规格 Lite Server服务器的规格。 ID Lite Server服务器的ID，可用于在费用中心查询。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理

总条数： 1917

上一页
1
...
85
86
87
...
96
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练脚本说明参考 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

配置Grafana数据源 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

（可选）配置镜像预热 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

查看Workflow工作流运行记录 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

查询导入任务列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查看Lite Server服务器详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线