搜索_华为云

新建Workflow Execution - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects 数据约束条件。 value 否 Map<String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
训练tokenizer文件说明 - AI开发平台ModelArts

放到模型权重目录Qwen-VL-Chat下。 # 然后将tokenization_qwen.py中30-35行注释，并重新定义变量FONT_PATH读取字体文件Simsun，修改如下： 30 # FONT_PATH = try_to_load_from_cache("Qwen/Qwen-VL-Chat"

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

SWR OperateAccess 必选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 必选 SMN消息服务授予子用户使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
查询服务更新日志 - AI开发平台ModelArts

String 服务ID。表2 Query参数参数是否必选参数类型描述 update_time 否 Number 待过滤的更新时间，查询在线服务更新日志可使用，可准确过滤出某次更新任务；默认不过滤。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
训练tokenizer文件说明 - AI开发平台ModelArts

放到模型权重目录Qwen-VL-Chat下。 # 然后将tokenization_qwen.py中30-35行注释，并重新定义变量FONT_PATH读取字体文件Simsun，修改如下： 30 # FONT_PATH = try_to_load_from_cache("Qwen/Qwen-VL-Chat"

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
投机推理使用说明 - AI开发平台ModelArts

平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 投机推理
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

Tenant Administrator 可选 CES云监控授予子账号使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 可选 SMN消息服务授予子账号使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
Yaml配置文件参数配置说明 - AI开发平台ModelArts

l_limit的值一致。 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true"，则在训练结束后，将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true"，则在每次训练开始时，都会清空输出目录，以便保存新的训练结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true"，则在训练结束后，将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true"，则在每次训练开始时，都会清空输出目录，以便保存新的训练结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

"desc_act": false } 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考启动在线推理服务。 python -m vllm.entrypoints.openai.api_server --model <your_model>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 量化
Yaml配置文件参数配置说明 - AI开发平台ModelArts

用于后续的训练或推理任务 plot_loss true 用于指定是否绘制损失曲线。如果设置为"true"，则在训练结束后，将损失曲线保存为图片 overwrite_output_dir true 是否覆盖输出目录。如果设置为"true"，则在每次训练开始时，都会清空输出目录，以便保存新的训练结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
创建数据集 - AI开发平台ModelArts

data_sources 是 Array of DataSource objects 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。目前仅支持传入单个DataSource。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

"desc_act": false } 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考启动在线推理服务。 python -m vllm.entrypoints.openai.api_server --model <your_model>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

# prints: [[1., 0., 0.]] 运行推理脚本。 python inference.py 由于./docs/CLIP.png图片是一张图表，因此结果值和第一个文本"a diagram"吻合，结果值会接近[[1., 0., 0.]]。 Step8 精度评估关闭数据集shuffle，保证训练数据一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
创建数据集导出任务 - AI开发平台ModelArts

source_type_header 否 String 指定导出标注文件中的OBS路径前缀，默认为“obs://”，支持指定“s3://”。由于训练无法解析以“obs”开头图片路径，需要导出manifest中的路径前缀为“s3://”。 status 否 Integer 任务状态。 task_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
依赖和委托 - AI开发平台ModelArts

业务场景依赖的服务委托授权项说明在线服务 LTS lts:groups:create lts:groups:list lts:topics:create lts:topics:delete lts:topics:list 建议配置，在线服务配置LTS日志上报。批量服务 OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
msprobe API预检 - AI开发平台ModelArts

cision_compare_details_{timestamp}.csv文件的API详细达标情况。详细工具的使用指导请参考离线预检和在线预检介绍。父主题： msprobe工具使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
使用AWQ量化工具转换权重 - AI开发平台ModelArts

Step2 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化

总条数： 468

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建Workflow Execution - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

msprobe API预检 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线