搜索_华为云

部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

/v1/{project_id}/services 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

not exist. 项目{1}资源规范编码{编码}记录不存在。检查资源规范编码是否设置正确，并确认其是否属于对应的项目下。 400 ModelArts.3837 Resource ID {id} of project {id} does not exist. 项目{1}资源ID {0}不存在。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
Eagle投机小模型训练 - AI开发平台ModelArts

的分类头来预测下一个词。hidden-state比input token包含更多信息，使得回归hidden-state的任务比预测词的任务简单得多。总之，Eagle在hidden-state层面上进行外推，使用一个小型单层Eagle模型，然后利用基模型的冻结的分类头生成预测的token。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询训练作业详情 - AI开发平台ModelArts

raining_job_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
终止训练作业 - AI开发平台ModelArts

job_id}/actions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数表2

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询指定网络资源的详情信息。删除网络资源删除指定网络资源。更新网络资源更新指定网络资源。表18 资源指标管理 API 说明查询资源实时利用率查询当前项目下所有资源池的实时利用率。表19 资源池管理 API 说明创建资源池用户创建资源池。查询资源池列表查询资源池列表。查询资源池查询指定资源池的详细信息。

帮助中心 > AI开发平台ModelArts > API参考
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

r_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下可存放项目所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/home/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

在实际应用中，预训练模型是在大规模通用数据集上训练得到的，而在特定任务上，这些模型的参数可能并不都是最合适的，因此需要进行微调。 AI Gallery的模型微调，简单易用，用户只需要选择训练数据、创建微调任务，模型微调就会对数据进行训练，快速生成模型。约束限制如果模型的“任务类型”是“文本问答”或“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
线下容器镜像构建及调试 - AI开发平台ModelArts

程。如果预置脚本调用结果不符合预期，可以在容器实例中进行修改和迭代。针对专属池场景由于专属池支持SFS挂载，因此代码、数据的导入会更简单，甚至可以不用再关注OBS的相关操作。可以直接把SFS的目录直接挂载到调试节点的"/mnt/sfs_turbo"目录，或者保证对应目录的内容和SFS盘匹配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
新建Workflow工作流 - AI开发平台ModelArts

/v2/{project_id}/workflows 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 name 是 String Workflow

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

pip install galleryformers 建议在虚拟环境（Python 3.8+）中安装AI Gallery SDK，以便管理不同的项目，避免依赖项之间产生兼容性问题。构建自定义模型。编写自定义配置类。模型的configuration包含了构建模型所需的所有信息的对象，需要尽可能完整。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查看模型评估结果 - AI开发平台ModelArts

下文将介绍如何在训练中使用评估代码。对训练代码做一定的适配和修正，分为三个方面：添加输出目录、复制数据集到本地、映射数据集路径到OBS。添加输出目录添加输出目录的代码比较简单，即在代码中添加一个输出评估结果文件的目录，被称为train_url，也就是页面上的训练输出位置。并把train_url添加到使用的函数a

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
训练的数据集预处理说明 - AI开发平台ModelArts

生成的指令数据集，用于微调。 GeneralPretrainHandler：默认。用于预训练时的数据预处理过程中，将数据集根据key值进行简单的过滤。 GeneralInstructionHandler：用于sft、lora微调时的数据预处理过程中，会对数据集full_promp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

成的文本数据集，用于预训练。 GeneralPretrainHandler：默认。用于预训练时的数据预处理过程中，将数据集根据key值进行简单的过滤。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

多模态检索：这是指利用多种数据模态(如文本、图像、视频、音频等)进行信息检索的技术，旨在通过整合不同形式的数据，提供更精准的结果。综上所述，多模态不仅仅是简单的特征融合，而是涵盖了广泛的理论基础及实践应用。这里的多模态是指多模态理解。约束限制机器以及最大卡数见各模型支持的最小卡数和最大序列。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）

总条数： 528

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署服务 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线