搜索_华为云

（可选）本地安装ma-cli - AI开发平台ModelArts

C:\Users\xxx>python --version Python *.*.* 执行命令pip --version，确认Python通用包管理工具pip已经存在。 C:\Users\xxx>pip --version pip **.*.* from c:\users\xxx\appd

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
附录：指令微调训练常见问题 - AI开发平台ModelArts

解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使用Accelerator可替换为Deepspeed-ZeRO-1，De

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
管理AI Gallery中的AI应用 - AI开发平台ModelArts

重启AI应用，使环境变量的新增、修改、删除生效。当AI应用的状态为“运行中”时，则在“运行资源设置”处，单击“重启”。当AI应用的状态为非“待启动”时，则环境变量的变更会随应用启动自动生效。管理AI应用可见范围创建AI应用时，默认“可见范围”是“私密”，且“仅自己可见”。创建完成后，支持修改可见范围。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
离线训练安装包准备说明 - AI开发平台ModelArts

scripts/install.sh 文件中，找到需要git clone的文件，如下列所示。运行git clone命令，并git checkout切换到指定的版本。注意：针对Megatron-LM下载完成后，需要将megatron文件夹复制至ModelLink中。 git clone https://gitee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
LoRA微调训练 - AI开发平台ModelArts

创建LoRA微调训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
什么是Workflow - AI开发平台ModelArts

线在持续产生的数据中持续迭代训练，确保这条流水线生产出来的模型始终维持在一个较好的状态。图1 MLOps MLOps的整条链路需要有一个工具去承载，MLOps打通了算法开发到交付运维的全流程。和以往的开发交付不同，以往的开发与交付过程是分离的，算法工程师开发完的模型，一般都需要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 7B lora/dpo 4096/8192 gradient_accumulation_steps:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
ModelArts Standard使用流程 - AI开发平台ModelArts

Standard是面向AI开发者的一站式开发平台，提供了简洁易用的管理控制台，包含自动学习、数据管理、开发环境、模型训练、模型管理、部署上线等端到端的AI开发工具链。 Standard的自动学习可以帮助用户零代码构建AI模型。自动学习功能根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

NotebookFlavor objects 分页数据。 flavors Array of NotebookFlavor objects 支持切换的规格列表。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Step2 创建预训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
Standard资源管理 - AI开发平台ModelArts

源。自助管理集群GPU/NPU驱动：每个用户对集群的驱动要求不同，在新版专属资源池列表页中，可自行选择加速卡驱动，并根据业务需要进行立即变更或平滑升级。父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts Standard资源监控概述 - AI开发平台ModelArts

Arts所有监控指标。方式三：通过Grafana查看所有监控指标当AOM的监控模板不能满足用户诉求时，用户可以使用Grafana可视化工具来查看与分析监控指标。Grafana支持灵活而又复杂多样的监控视图和模板，为用户提供基于网页仪表面板的可视化监控效果，使用户更加直观地查看到实时资源使用情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

核IO已经阻塞，无法执行相关GPU命令，只能尝试释放D+进程。处理方法 “nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
离线训练安装包准备说明 - AI开发平台ModelArts

scripts/install.sh 文件中，找到需要git clone的文件，如下列所示。运行git clone命令，并git checkout切换到指定的版本。注意：针对Megatron-LM下载完成后，需要将megatron文件夹复制至ModelLink中。 git clone https://gitee

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

修改ChatGLMv4-9B tokenizer文件图5 修改ChatGLMv4-9B tokenizer文件 Qwen系列在进行HuggingFace权重转换Megatron前，针对Qwen系列模型（qwen-7b、qwen-14b、qwen-72b）中的tokenizer 文件，需要修改代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考

总条数： 867

上一页
1
...
35
36
37
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

（可选）本地安装ma-cli - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线