搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、在容器中使用ma-user用户运行以下命令下载并安装AutoAWQ源码。 bash build.sh 2、运行“examples/quantize.py”文件进行模型量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
执行训练任务（历史版本） - AI开发平台ModelArts

要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。同时开启故障快恢和断点续训时需满足以下条件：如果用户指定${USER_CONVERTED_CKPT_PATH} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${OUTPUT_SAV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
查看诊断报告 - AI开发平台ModelArts

梯度裁剪和亲和优化器等多个可替换的API，用户可根据代码堆栈找到需要替换的具体源码，然后根据API instruction跳转后的参考文档修改源代码，从而使能亲和API提升训练性能。注意这里提示的亲和API并非都能提升训练性能，需要用户替换后实测，由于有一定代码修改和测试成本，因此优先级可以视作最低。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

} ] } ] 当"mmcv-full"安装失败，原因可能是基础镜像中没有安装gcc，无法编译导致安装失败，此时需要用户使用线下wheel包安装。示例如下： "dependencies": [ { "installer": "pip",

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
训练性能测试 - AI开发平台ModelArts

yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下： --o <output_dir>： <可选>任务完成输出excel表格路径，默认为"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

acy_cfgs.yaml相对或绝对路径 --dataset <dataset>：评估数据集；可选值：gsm8k、all，默认值为all，用户只需选择参数即可，数据集路径eval接口已指定好。 --model_name <model_name>：训练模型名 --run_type

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.5.901） > 训练评测
Prefix Caching - AI开发平台ModelArts

Ascend vllm提供prefix caching关键特性能力，能够显著降低长system prompt和多轮对话场景首token时延，提升用户体验。其优势主要包括：更短的prefill时间：由于跨请求的重复token序列对应的KV Cache可以复用，那么就可以减少一部分前缀token的KV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
查询数据处理任务的版本列表 - AI开发平台ModelArts

tasks/{task_id}/versions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。表2 Query参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
SFT全参微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

/configs/unet.ini 最多支持100档配置，每一档通过英文逗号分隔。如果用户设置的dim数值过大或档位过多，可能会导致模型编译失败，此时建议用户减少档位或调低档位数值。如果用户设置了动态维度，实际推理时，使用的输入数据的shape需要与设置的档位相匹配。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
创建训练作业镜像保存任务 - AI开发平台ModelArts

{task_id}/save-image-job 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取样本搜索条件 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 labelers

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取训练作业支持的公共规格 - AI开发平台ModelArts

/v2/{project_id}/training-job-flavors 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 flavor_type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用AWQ量化工具转换权重 - AI开发平台ModelArts

co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。 1、在容器中使用ma-user用户， vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

AutoAWQ量化工具的适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/AutoAWQ目录下。 1、在容器中使用ma-user用户, vLLM使用transformers版本与awq冲突，需要切换conda环境，运行以下命令下载并安装AutoAWQ源码。 conda create

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图3 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
训练精度测试 - AI开发平台ModelArts

fgs.yaml相对或绝对路径 --dataset <dataset>：评估数据集；可选值：all、mmlu、ceval，默认值为all，用户只需选择参数即可，数据集路径eval接口已指定好。 --model_name <model_name>：训练模型名 --run_type

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

fgs.yaml相对或绝对路径 --dataset <dataset>：评估数据集；可选值：all、mmlu、ceval，默认值为all，用户只需选择参数即可，数据集路径eval接口已指定好。 --model_name <model_name>：训练模型名 --run_type

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练benchmark工具
更新数据集 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 add_labels 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1255

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

创建训练作业镜像保存任务 - AI开发平台ModelArts

获取样本搜索条件 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

更新数据集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线