搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在 (0, 1] 范围内。设置为1表示考虑所有tokens。 temperature 否 1.0 Float 控制采样的随机性的浮点数。较低的值使模型更加确定性，较高的值使模型更加随机。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907）
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

说明：为确保训练模型的精度，建议将训练集比例设置为0.8或者0.9。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。 “描述” 针对当前发布的数据集版本的描述信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
批量重启节点 - AI开发平台ModelArts

批量重启节点功能介绍批量重启指定资源池中的节点调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/pools/{pool_name

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gradient_accumulation_steps

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
批量删除节点 - AI开发平台ModelArts

批量删除节点功能介绍批量删除指定资源池中的节点，资源池中至少保留一个节点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询节点池列表 - AI开发平台ModelArts

查询节点池列表功能介绍查询节点池列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name}

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询指定节点池详情 - AI开发平台ModelArts

查询指定节点池详情功能介绍查询指定节点池详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列基于vLLM（v0.6.3）部署推理服务时，不同模型推理支持的最小昇腾卡数和对应卡数下的max-model-len长度说明，如下面的表格所示。以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

ModelArts的AI Gallery中提供了常见的精度较高的算法和相应的训练数据集，用户可以在AI Gallery的资产集市中获取。后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

ModelArts的AI Gallery中提供了常见的精度较高的算法和相应的训练数据集，用户可以在AI Gallery的资产集市中获取。后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
执行训练任务 - AI开发平台ModelArts

选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。设置fp16为True。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
执行训练任务 - AI开发平台ModelArts

选用数据精度格式bf16或fp16二者选一，两者区别可查看BF16和FP16说明。 bf16，配置以下参数。 bf16: true fp16，相比bf16还需配置loss scale参数，配置如下。设置fp16为True。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
节点池管理 - AI开发平台ModelArts

节点池管理查询节点池列表创建节点池查询指定节点池详情更新节点池删除节点池查询节点池的节点列表

 帮助中心 > AI开发平台ModelArts > API参考
创建Workflow节点 - AI开发平台ModelArts

创建Workflow节点创建Workflow数据集节点创建Workflow数据集标注节点创建Workflow数据集导入节点创建Workflow数据集版本发布节点创建Workflow训练作业节点创建Workflow模型注册节点创建Workflow服务部署节点父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
Standard模型部署 - AI开发平台ModelArts

Standard模型部署 ModelArts Standard提供模型、服务管理能力，支持多厂商多框架多功能的镜像和模型统一纳管。通常AI模型部署和规模化落地非常复杂。例如，智慧交通项目中，在获得训练好的模型后，需要部署到云、边、端多种场景。如果在端侧部署，需要一次性部署到不同规格

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
执行LoRA微调训练任务 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行LoRA微调训练任务 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）

总条数： 1192

上一页
1
...
12
13
14
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

批量重启节点 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

批量删除节点 - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

节点池管理 - AI开发平台ModelArts

创建Workflow节点 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线