搜索_华为云

准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为text。在维基百科数据集中，它有四列，分别是i

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
性能调优总体原则和思路 - AI开发平台ModelArts

个或几个亲和算子组合的形式，代替原有GPU的实现方式，具体逻辑模型请参考PyTorch自动迁移。在PyTorch模型迁移后进行训练的过程中，CPU只负责算子的下发，而NPU负责算子的执行，算子下发和执行异步发生，性能瓶颈在此过程中体现。在PyTorch的动态图机制下，算子被CP

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

Spark应用每个Executor的CPU核数。该配置项会替换sc_type中对应的默认参数。 -em / --executor-memory String 否 Spark应用的Executor内存，参数配置例如2G，2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必须带单位，否则会启动失败。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

用户也可以自行准备训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为text。在维基百科数据集中，它有四列，分别是i

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
自定义脚本代码示例 - AI开发平台ModelArts

在模型代码推理文件customize_service.py中，需要添加一个子类，该子类继承对应模型类型的父类，各模型类型的父类名称和导入语句如请参考表1。本案例中调用父类“_inference(self, data)”推理请求方法，因此下文代码中不需要重写方法。 1 2 3 4 5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
工具介绍及准备工作 - AI开发平台ModelArts

创建test-benchmark目录，该目录存放训练生成的权重文件及训练日志。 # 任意目录创建 mkdir test-benchmark 修改yaml文件参数中model_name_or_path、dataset_dir和dataset或eval_dataset参数配置，修改代码目录下accuracy_cfgs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
使用AWQ量化工具转换权重 - AI开发平台ModelArts

co/models?sort=trending&search=QWEN+AWQ 方式二：使用AutoAWQ量化工具进行量化。在Notebook中运行以下命令下载并安装AutoAWQ源码。 git clone -b v0.2.5 https://github.com/casper-hansen/AutoAWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
解析Manifest文件 - AI开发平台ModelArts

hard_coefficient Double 难度系数，范围为[0,1]。 hard_reasons String 标签级别难例原因。通过中划线间隔单个难例原因ID。 source_map String source的映射。表4 annotation标注属性参数参数类型描述

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
工具介绍及准备工作 - AI开发平台ModelArts

创建test-benchmark目录，该目录存放训练生成的权重文件及训练日志。 # 任意目录创建 mkdir test-benchmark 修改yaml文件参数中model_name_or_path、dataset_dir和dataset或eval_dataset参数配置，修改代码目录下accuracy_cfgs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct 说明：当前版本中yi-34b、qwen1.5-32b模型暂不支持单卡启动。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建导入任务 - AI开发平台ModelArts

示例二：物体检测数据集Manifest文件导入 annotation_config = dict() # Manifest文件导入任务中，传入annotation_config参数可以导入标注信息 import_resp = dataset.import_data(

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 导入任务管理
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

备用系统，维持模型训练不中断，保护长期项目免受时间与资源损耗，确保进展与收益。大模型应用开发，帮助开发者快速构建智能Agents 在企业中，项目级复杂任务通常需要理解任务并拆解成多个问题再进行决策，然后调用多个子系统去执行。MaaS基于多个优质昇腾云开源大模型，提供优质Prom

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
创建可视化作业 - AI开发平台ModelArts

表2 请求参数参数是否必选参数类型说明 job_name 是 String 可视化作业名称。限制为1-20位只含数字，字母，下划线，中划线的名称。 job_desc 否 String 对可视化作业的描述，默认为空，字符串的长度限制为[0, 256]。 train_url 是

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

save_pretrained("CodeLlama-34b-hf") 步骤二：启动量化服务使用量化模型需要在NPU的机器上运行。在模型的保存目录中创建quant_config.json文件，bits必须设置为8，指定量化为int8；group_size必须设置为-1，指定不使用perg

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
查询训练作业详情 - AI开发平台ModelArts

nfs_server_path String nfs服务端路径。 local_path String 挂载到训练容器中的路径。 read_only Boolean nfs挂载卷在容器中是否只读。表53 log_export_path 参数参数类型描述 obs_url String 训练作业日志保存的OBS地址。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
创建训练作业版本 - AI开发平台ModelArts

d同时出现。 pool_id 是 String 专属资源池ID。可在ModelArts管理控制台，单击左侧“专属资源池”，在专属资源池列表中查看资源池ID。创建专属池作业时，pool_id必选，且不能与spec_id同时出现。 engine_id 是 Long 训练作业选择的引擎

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
推理部署计费项 - AI开发平台ModelArts

专属资源池的费用请参考专属资源池计费项。 - - 存储资源对象存储OBS 用于存储批量部署服务的输入和输出数据。具体费用可参见对象存储价格详情。注意：存储到OBS中的数据需在OBS控制台进行手动删除。如果未删除，则会按照OBS的计费规则进行持续计费。按需计费包年/包月创建桶不收取费用，按实际使用的存储容量和时长收费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
使用GPTQ量化 - AI开发平台ModelArts

save_pretrained("CodeLlama-34b-hf") 使用量化模型使用量化模型需要在NPU的机器上运行。 1. 在模型的保存目录中创建quant_config.json文件，bits必须设置为8，指定量化为int8；group_size必须设置为-1，指定不使用perg

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

save_pretrained("CodeLlama-34b-hf") 使用量化模型使用量化模型需要在NPU的机器上运行。 1. 在模型的保存目录中创建quant_config.json文件，bits必须设置为8，指定量化为int8；group_size必须设置为-1，指定不使用perg

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

save_pretrained("CodeLlama-34b-hf") 使用量化模型使用量化模型需要在NPU的机器上运行。 1. 在模型的保存目录中创建quant_config.json文件，bits必须设置为8，指定量化为int8；group_size必须设置为-1，指定不使用perg

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化

总条数： 1993

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据 - AI开发平台ModelArts

性能调优总体原则和思路 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线