搜索_华为云

部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.6.3框架部署并启动推理服务。前提条件已准备好Lite k8s Cluster环境，具体参考准备环境。推荐使用“西南-贵阳一”Region上的Cluster和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保集群可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。前提条件已准备好Lite k8s Cluster环境，具体参考准备环境。推荐使用“西南-贵阳一”Region上的Cluster和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保集群可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
边缘服务 - AI开发平台ModelArts
边缘服务 - AI开发平台ModelArts

边缘服务什么是边缘节点？更新AI应用版本时，边缘服务预测功能不可用？使用边缘节点部署边缘服务能否使用http接口协议？父主题：部署上线

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
使用MaaS部署模型服务 - AI开发平台ModelArts

Studio左侧导航栏中，选择“模型部署”进入服务列表。单击“部署模型服务”进入部署页面，完成创建配置。表1 部署模型服务参数说明服务设置服务名称自定义部署模型服务的名称。支持1~64位，以中文、大小写字母开头，只包含中文、大小写字母、数字、中划线、下划线的名称。描述部署模型服务的简介。支持256字符。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

镜像分离，在服务部署时动态将模型加载到服务负载。配置健康检查大模型场景下导入的模型，要求配置健康检查，避免在部署时服务显示已启动但实际不可用。图3 采用自定义引擎，开启动态加载并配置健康检查示例图部署在线服务部署服务时，需满足以下参数配置：自定义部署超时时间大模型加

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错问题现象在线服务预测报错：ERROR: data is shorter than windows。原因分析该报错说明预测使用的数据行数小于window超参值。在使用订阅算法时序预测-time_series_v

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

前提条件在线服务部署时需选择“升级为WebSocket”。在线服务中的模型导入选择的镜像需支持WebSocket协议。约束与限制 WebSocket协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

出现此问题现象，通常是因为您部署的模型过大导致的。解决方法如下：精简模型，重新导入模型和部署上线。购买专属资源池，在部署上线为在线服务时，使用专属资源池进行部署。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
推理部署使用场景 - AI开发平台ModelArts

为云OBS服务。创建模型：把模型文件和推理文件导入到ModelArts的模型仓库中，进行版本化管理，并构建为可运行的模型。部署服务：模型构建完成后，根据您的业务场景，选择将模型部署成对应的服务类型。将模型部署为实时推理作业将模型部署为一个Web Service，并且提供在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
部署上线 - AI开发平台ModelArts
部署上线 - AI开发平台ModelArts

部署上线功能咨询在线服务边缘服务父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？问题现象服务部署、启动、升级和修改时，镜像不断重启。原因分析容器镜像代码错误解决方法根据容器日志进行排查，修复代码，重新创建模型，部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

在部署为在线服务时，即“部署”页面，填写部署服务相关参数时，开启支持APP认证功能。针对已部署完成的在线服务，进入在线服务管理页面，单击目标服务名称“操作”列的“修改”按钮，进入修改服务页面开启支持APP认证功能。图1 部署页面开启支持APP认证功能选择APP授权配置。从下拉列表中选择您需要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
在线服务部署是否支持包周期？ - AI开发平台ModelArts

在线服务部署是否支持包周期？在线服务不支持包周期的计费模式。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

在线服务和边缘服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。边缘服务云端服务是集中化的离终端设备较远，对于实时性要求高的计算需求，把计算放在云上会引起网络延时变长、网络拥塞、服务质量下降等问题。而终端设备通常计算能力不

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
自动学习中部署上线是将模型部署为什么类型的服务？ - AI开发平台ModelArts

自动学习中部署上线是将模型部署为什么类型的服务？自动学习中部署上线是将模型部署为在线服务，您可以添加图片或代码进行服务测试，也可以使用URL接口调用。部署成功后，您也可以在ModelArts管理控制台的“部署上线 > 在线服务”页面中，查看到正在运行的服务。您也可以在此页面停止服务或删除服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 部署上线

总条数： 1490

上一页
1
2
3
4
5
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

边缘服务 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

部署上线 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

在线服务部署是否支持包周期？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

自动学习中部署上线是将模型部署为什么类型的服务？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线