搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──intall.sh # 安装脚本 |——dependences.yaml # 需要的三方依赖包的版本和下载地址 |──scripts_llamafactory/ # llamafactory兼容旧版本启动方式目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
推理精度测试 - AI开发平台ModelArts

- BradyFU/Awesome-Multimodal-Large-Language-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。 EPOCH 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 TRAIN_ITERS SN / GBS * EPOCH 非必填。表示训练step迭代次数，根据实际需要修改。 SEED 1234 随机种子数。每次数据采样时，保持一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。 EPOCH 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 TRAIN_ITERS SN / GBS * EPOCH 非必填。表示训练step迭代次数，根据实际需要修改。 SEED 1234 随机种子数。每次数据采样时，保持一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
管理Workflow StepExecution - AI开发平台ModelArts

停止 continue 继续 data_requirements 否 Array of DataRequirement objects 工作流需要的数据。 parameters 否 Array of WorkflowParameter objects 参数。表3 DataRequirement

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

理、代码管理等动作。本章节介绍如何使用VS Code插件创建训练作业并调试。使用VS Code插件创建训练作业并调试功能目前是白名单，需要提交工单申请开通。准备工作创建OBS桶，桶名称示例：“xxx-project”，在OBS桶里创建“data”文件夹。（建议下载OBS Browser+进行相关操作）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
创建处理任务 - AI开发平台ModelArts

是否必选参数类型描述 create_version 否 Boolean 创建任务时是否同步创建一个任务版本。该参数仅创建数据处理任务时需要设为“true”，其他类型任务均设为“false”或不设。可选值如下： true：创建任务时同步创建一个任务版本 false：创建任务时不创建任务版本（默认值）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

batch等功能，能够提高GPU的使用率，改善推理服务的性能。当从第三方推理框架迁移到使用ModelArts推理的模型管理和服务管理时，需要对原生第三方推理框架镜像的构建方式做一定的改造，以使用ModelArts推理平台的模型版本管理能力和动态加载模型的部署能力。本案例将指导用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询算法详情 - AI开发平台ModelArts

String 算法的代码目录。如：“/usr/app/”。应与boot_file一同出现。 boot_file String 算法的代码启动文件，需要在代码目录下。如：“/usr/app/boot.py”。应与code_dir一同出现。 command String 自定义镜像算法的容器启动命令。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询服务详情 - AI开发平台ModelArts

object 自定义资源规格配置，仅当specification配置为custom时返回。 envs Map<String,String> 运行模型需要的环境变量键值对。 specification String 资源规格，例如：modelarts.vm.cpu.2u/modelarts.vm

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
扩缩容Standard专属资源池 - AI开发平台ModelArts

订。单击某个资源池操作列右侧的“扩缩容”，进入“专属资源池扩缩容”页面，对资源池进行扩缩容操作。对于包周期资源池，此按钮为“扩容”，如果需要缩容，请进入到包周期资源池详情页对节点进行退订操作。在“专属资源池扩缩容”页面，可通过增减“目标总实例数”实现扩缩容，请用户根据本身业务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
LoRA微调训练 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step3 启动训练脚本修改超参值后，再启动训练脚本。Llama2-70b建议为4机32卡训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
创建Workflow数据集节点 - AI开发平台ModelArts

DataTypeEnum.IMAGE, # 数据集对应的数据类型, 示例为图像 ) ) # 注意dataset_name这个参数配置的数据集名称需要用户自行确认在该账号下未被他人使用，否则会导致期望的数据集未被创建，而后续节点错误使用了他人创建的数据集 workflow = wf.Workflow(

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。单击某个资源池操作列的“扩缩容”对资源池进行扩缩容。对于为包周期资源池，此按钮为“扩容”，若需要缩容，请进入到包周期资源池详情页对节点进行退订操作。在“专属资源池扩缩容”页面，可通过增减“目标总实例数”实现扩缩容，请用户根据本身业务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
SFT全参微调训练任务 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step3 启动训练脚本修改超参值后，再启动训练脚本。其中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
查询数据集导出任务列表 - AI开发平台ModelArts

通过样本属性搜索。 parent_sample_id String 父样本ID。 sample_dir String 根据样本所在目录搜索（目录需要以/结尾），只搜索指定目录下的样本，不支持目录递归搜索。 sample_name String 根据样本名称搜索（含后缀名）。 sample_time

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1520

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

查询数据集导出任务列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线