搜索_华为云

模型训练使用流程 - AI开发平台ModelArts

模型训练有多种训练框架来源，具体可以参考准备模型训练镜像。 ModelArts Standard平台提供了模型训练常用的预置框架，可以直接使用。当预置框架不满足训练要求时，支持用户构建自定义镜像用于训练。准备训练数据训练数据除了训练数据集，也可以是预测模型。在创建训练作业前，需要先准备好训练数据。当

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc3。 Server驱动版本要求23.0.6 PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.908版本相对于6.3.907版本新增如下内容：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
自定义引擎创建模型规范 - AI开发平台ModelArts

自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建模型时填写与您镜像中相同的启动命令。提供的服务可使用HTTPS/HTTP协议和监听的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker exec -it ${container_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
创建训练作业 - AI开发平台ModelArts

SchedulePolicy 参数是否必选参数类型描述 required_affinity 否 RequiredAffinity object 训练作业亲和要求 priority 否 Integer 训练作业优先级 preemptible 否 Boolean 是否可以被抢占(tag:hcs) 表52

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

PT4/alpaca_gpt4_data.json，数据大小：43.6 MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json或jsonl格式的数据，数据集中的每个样本包含的标签保持一致，且必须包含text标签。实际训练过程中只会读取该字段。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建模型时填写与您镜像中相同的启动命令。提供的服务可使用HTTPS/HTTP协议和监听的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在Workflow中更新已部署的服务 - AI开发平台ModelArts

default="True", description="是否使用混合精度, 混合精度可以加速训练，但是可能会造成一点精度损失，如果对精度无极严格的要求，建议开启")), wf.AlgorithmParameters(name="xla_compile", value=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在scripts文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
手动部署推理服务 - AI开发平台ModelArts

moe_ep=16。 NPU_MEMORY_FRACTION：表示显存比。修改config.json文件中的服务化参数。config.json文件修改要求和样例参考附录：config.json文件。 cd /usr/local/Ascend/mindie/latest/mindie-service/

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

术支持购买Lite Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B单机单卡。表1 环境要求模型版本 CANN cann_8.0.rc1 PyTorch pytorch_2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

技术支持购买Lite Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B单机。表1 环境要求名称版本 driver 23.0.6 PyTorch pytorch_2.1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--max-cpu-loras=32 --enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--max-cpu-loras=32 --enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

当“MA_RUN_METHOD=torchrun”时，表示ModelArts Standard平台使用torchrun命令启动训练作业的“启动文件”。要求PyTorch版本大于等于1.11.0。单机时，ModelArts Standard平台使用如下命令启动训练作业的“启动文件”。 torchrun

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

Request功能在新建的窗口中填入WebSocket连接信息：左上角选择Raw，不要选择Socket.IO（一种WebSocket实现，要求客户端跟服务端都要基于Socket.IO），地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在scripts文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在scripts文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作

总条数： 733

上一页
1
...
17
18
19
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型训练使用流程 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

手动部署推理服务 - AI开发平台ModelArts

Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线