搜索_华为云

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至达到能执行静态bench

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
自定义镜像规范 - AI开发平台ModelArts

py示例。如果是SWR容器内的地址，则填写绝对路径；如果是AI Gallery仓库内的地址，则填写相对路径。同时，还需要在“模型文件”添加gallery_train文件夹，文件夹内容参考表2。表2 gallery_train文件列表文件类型文件说明 “train_params

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查询数据集的版本列表 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 status 否 Integer 数据集版本状态。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除节点池 - AI开发平台ModelArts

{nodepool_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gpu-memory-utilization为0.9下，以4k、8k、16k递增max-model-len，直至达到能执行静态bench

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
查询数据集导入任务的详情 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 任务ID。请求参数无响应参数状态码： 200 表2 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询节点池列表 - AI开发平台ModelArts

name}/nodepools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数无响应参数状态码：200 表2 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
资源池监控 - AI开发平台ModelArts

l_name}/monitor 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 系统生成的资源池名称。表2 Query参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。表2 支持的模型列表序号支持模型支持模型参数量权重文件获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
更新节点池 - AI开发平台ModelArts

{nodepool_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。表2 支持的模型类型和权重获取地址序号支持模型支持模型参数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 准备工作
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

e/run_mpi.sh python ${MA_JOB_DIR}/demo-code/mpi-verification.py 环境变量：添加“MY_SSHD_PORT = 38888” 资源池：选择公共资源池类型：选择GPU规格计算节点个数：选择“1”或“2” 永久保存日志：打开

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

Console中上传，当文件大于100个时，推荐使用工具，推荐OBS Browser+（win）、obsutil（linux）。上述例子为obsutil使用方法。准备算法 main.py文件内容如下，并将其上传至OBS桶的demo文件夹中： import argparse import os import

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

/{algorithm_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id 是 String 算法ID。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建节点池 - AI开发平台ModelArts

name}/nodepools 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询开发环境实例列表 - AI开发平台ModelArts

Path参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 query请求参数参数是否必选参数类型说明 de_type 是 String 开发环境类型，当前

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询数据集列表 - AI开发平台ModelArts

/v2/{project_id}/datasets 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 check_running_task 否 Boolean

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集详情 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 check_running_task 否 Boolean

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
数据管理权限 - AI开发平台ModelArts

ions/samples modelarts:sample:listSamples obs:object:GetObject √ √ 批量添加样本 POST /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
multi-step - AI开发平台ModelArts
multi-step - AI开发平台ModelArts

multi-step 什么是multi-step vLLM的调度和输入准备的CPU开销可能会导致NPU利用率不足，开启multi-step调度可以有效解决这个问题，开启multi-step调度后会在执行一次调度和输入准备后，连续n步运行模型。通过NPU在n步之间连续处理，而无需等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用

总条数： 1779

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

更新节点池 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

上传数据和算法至OBS（首次使用时需要） - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

multi-step - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线