搜索_华为云

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

调用API接口部署在线服务时，“pool_name”为“资源池ID” 。图1 资源池ID 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

在线服务在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。将模型部署为一个Web Service，并且提供在线的测试UI与监控能力。

帮助中心 > AI开发平台ModelArts > 功能总览
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）推理场景介绍部署推理服务推理性能测试推理精度测试附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 eagle 投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

推理性能和精度测试操作请参见推理性能测试和推理精度测试。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

图1 自动学习生成的模型自动学习生成的模型，支持哪些其他操作支持部署为在线服务、批量服务或边缘服务。在自动学习页面中，仅支持部署为在线服务，如需部署为批量服务或边缘服务，可在“模型管理 > 模型”页面中直接部署。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用窍门
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

图1 自动学习生成的模型自动学习生成的模型，支持哪些其他操作支持部署为在线服务、批量服务或边缘服务。在自动学习页面中，仅支持部署为在线服务，如需部署为批量服务或边缘服务，可在“模型部署”页面部署。支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？

帮助中心 > AI开发平台ModelArts > 常见问题
ModelArts最佳实践案例列表 - AI开发平台ModelArts

ModelArts Standard推理部署表4 推理部署列表样例对应功能场景说明基于ModelArts Standard一键完成商超商品识别模型部署在线服务物体检测此案例以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程

 帮助中心 > AI开发平台ModelArts > 最佳实践

总条数： 518

上一页
1
...
10
11
12
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线