搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。 Step4 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图2 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
训练的数据集预处理说明 - AI开发平台ModelArts

_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

现_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以llama2为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

ep_execution_id}/metrics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询专属资源池作业统计信息 - AI开发平台ModelArts

ls/{pool_name}/workloads 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 作业所属的资源池。请求参数无响应参数状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备BF16权重 - AI开发平台ModelArts

准备FP8至BF16权重转换脚本fp8_cast_bf16.py，具体脚本内容参见权重转换脚本文件fp8_cast_bf16.py。权重转换需要使用有CPU资源的机器，建议直接登录Lite Server节点执行权重转换。在Server机器上创建权重转换后的存放目录${path-to-file}/deepseekV3

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 准备权重
查询训练作业镜像保存任务 - AI开发平台ModelArts

{task_id}/save-image-job 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取支持的超参搜索算法 - AI开发平台ModelArts

/v2/{project_id}/search-algorithms 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 search_algo_count

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
按标签名称更新单个标签 - AI开发平台ModelArts

dataset_id 是 String 数据集ID。 label_name 是 String 标签名称。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 label_type 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询处理任务列表 - AI开发平台ModelArts

/v2/{project_id}/processor-tasks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询标注团队列表 - AI开发平台ModelArts

/v2/{project_id}/workforces 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
手动续费 - AI开发平台ModelArts
手动续费 - AI开发平台ModelArts

续费。统一包年/包月资源的到期日如果您持有多台到期日不同的专属资源池，可以将到期日统一设置到一个日期，便于日常管理和续费。图2展示了用户将两个不同时间到期的资源，同时续费一个月，并设置“统一到期日”后的效果对比。图2 统一到期日更多关于统一到期日的规则请参见如何设置统一到期日。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
查询资源实时利用率 - AI开发平台ModelArts

/v2/{project_id}/metrics/runtime/pools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 apiVersion

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用AWQ量化 - AI开发平台ModelArts

co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、在容器中使用ma-user用户运行以下命令下载并安装AutoAWQ源码。 bash build.sh 2、运行“examples/quantize.py”文件进行模型量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
执行训练任务（历史版本） - AI开发平台ModelArts

要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。同时开启故障快恢和断点续训时需满足以下条件：如果用户指定${USER_CONVERTED_CKPT_PATH} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${OUTPUT_SAV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
解析Manifest文件 - AI开发平台ModelArts

置信度，数值类型，范围0<=confidence<=1，表示机器标注的置信度。 creation_time String 创建该标注的时间。是用户写入标注的时间，不是Manifest生成时间。 annotated_by String 标注人。 annotation_format String

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
创建数据集标注版本 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 clear_hard_property

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练性能测试 - AI开发平台ModelArts

yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下： --o <output_dir>： <可选>任务完成输出excel表格路径，默认为"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --distributed-executor-backend：多卡推理启动后端，可选值为"ray"或者"mp"，其中"ray"表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用AWQ量化 - AI开发平台ModelArts

co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在容器中使用ma-user用户运行以下命令下载并安装AutoAWQ源码。 git clone -b v0.2.5 https://github.com/casper-hansen/AutoAWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） > 推理模型量化

总条数： 2112

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

准备BF16权重 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

获取支持的超参搜索算法 - AI开发平台ModelArts

按标签名称更新单个标签 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

查询标注团队列表 - AI开发平台ModelArts

手动续费 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

创建数据集标注版本 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线