搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

${base_image}为基础镜像地址。 ${image_name}为推理镜像名称，可自行指定。运行完后，会生成推理所需镜像。步骤五生成ranktable 介绍如何生成ranktable，以1p1d-tp2分离部署模式为例。当前1p1d分离部署模式，全量节点和增量节点分别占用2张卡，一共使用4张卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
Standard自动学习 - AI开发平台ModelArts

根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型 ModelArts自动学习，为资深级用户提供模板化开发能力提供“自动学习白盒化”能力，开放模型参数、自动生成模型，实现模板化开发，提高开发效率采用自动深度学习技术，通过迁移学习（只通过少量数据生成高质量的模型），多维度下的模型

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
查询数据集导出任务的状态 - AI开发平台ModelArts

功能介绍查询数据集导出任务的状态。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{resource_i

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
分离部署推理服务 - AI开发平台ModelArts

0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是否开启流式推理。默认为False，表示不开启流式推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{dataset_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
分离部署推理服务 - AI开发平台ModelArts

0表示贪婪采样。 stop 否 None None/Str/List 用于停止生成的字符串列表。返回的输出将不包含停止字符串。例如：["你"，"好"]，生成文本时遇到"你"或者"好"将停止文本生成。 stream 否 False Bool 是否开启流式推理。默认为False，表示不开启流式推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

ffusion_checkpoint_to_onnx.py脚本中，可以通过执行以下命令生成onnx模型。其中，model_path指定PyTorch的模型根目录，output_path指定生成的onnx模型目录。 cd /home_host/work python diffuse

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
查询数据集的版本列表 - AI开发平台ModelArts

功能介绍查询指定数据集的版本列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{dataset_id}/versions

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Open-Sora1.2基于Lite Server适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

-OpenSoraVAE_V1_2/epochX-global_step1000/model，X为按顺序自动生成的数字）具体位置打印在日志中，注意：输出文件夹是自动生成，只有日志中打印的位置才是保存权重的位置。图3 VAE第一阶段训练日志第二阶段训练 export pret

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
确认智能标注作业的数据难例 - AI开发平台ModelArts

的标签是否准确。勾选标注不准确的图片，删除错误标签，然后在右侧“标签名”处添加准确标签。单击“确认”，勾选的图片及其标注情况，将呈现在“已标注”页签下。选中的图片为标注错误图片，在右侧删除错误标签，然后在标签名处添加“狗”的标签，然后单击“确认”，完成难例确认。将数据集中的数据标注为难例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
PD分离部署使用说明 - AI开发平台ModelArts

执行后，会生成一个global_ranktable.json文件和使用实例个数的local_ranktable.json文件；如果指定了--api-server，还会生成一个local_ranktable_host.json文件用于确定服务入口实例。 ./save_dir生成rank

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
PD分离部署使用说明 - AI开发平台ModelArts

执行后，会生成一个global_ranktable.json文件和使用实例个数的local_ranktable.json文件；如果指定了--api-server，还会生成一个local_ranktable_host.json文件用于确定服务入口实例。 ./save_dir生成rank

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
查询数据集列表 - AI开发平台ModelArts

根据指定条件分页查询用户创建的所有数据集。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets 表1 路径参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询样本列表 - AI开发平台ModelArts

查询样本列表功能介绍分页查询样本列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{dataset_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
投机推理使用说明 - AI开发平台ModelArts

加上校验后，执行一次完整投机流程的时间也仅为大模型的1.5倍左右（投机步数设置为3步）。而这一次投机流程，平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 投机推理
guided-decoding - AI开发平台ModelArts

Schema通过定义对象属性、类型、格式的方式来引导模型生成一个包含用户信息的JSON对象。其优势主要如下：上下文引导：通过提供特定的提示或上下文信息，模型可以更好地理解生成内容的方向。约束生成：可以设定某些限制条件，如关键词、主题或风格，使生成的内容更加一致和相关。提高质量：通过引导，生成的文本通常更具逻辑性和连贯性，减少无关信息的出现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

图模式什么是PTA图模式 PTA图模式使用TorchAir框架（继承自PyTorch框架Dynamo模式）在昇腾NPU上进行图模式推理，可达到最大化消除算子下发瓶颈的目的。推荐在小模型以及MOE模型的场景开启PTA图模式，如Qwen2-1.5B，Qwen2-0.5B，mixtr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的不同训练阶段方案，包括指令监督微调、DPO偏好训练、RM奖励模型训练、PPO强化训练方案。 DPO(Direct

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

4，执行如下命令使用官方权重推理。 bash sample_video_65.sh 使用训练生成的权重文件推理在Step7 启动训练服务完成后，会在工作目录/home/ma-user/Open-Sora-Plan1.0/下自动生成一个t2v-f17-256-img4-videovae488-bf16

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
guided-decoding - AI开发平台ModelArts

Schema通过定义对象属性、类型、格式的方式来引导模型生成一个包含用户信息的JSON对象。其优势主要如下：上下文引导：通过提供特定的提示或上下文信息，模型可以更好地理解生成内容的方向。约束生成：可以设定某些限制条件，如关键词、主题或风格，使生成的内容更加一致和相关。提高质量：通过引导，生成的文本通常更具逻辑性和连贯性，减少无关信息的出现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用

总条数： 973

上一页
1
...
4
5
6
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

Open-Sora1.2基于Lite Server适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

确认智能标注作业的数据难例 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Open-Sora-Plan1.0基于Lite Server适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线