搜索_华为云

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

模型，加载模型，执行预处理，完成推理，拼装响应体等。操作步骤 WebSocket在线服务开发操作步骤如下：上传镜像至容器镜像服务使用镜像创建模型使用模型部署在线服务 WebSocket在线服务调用上传镜像至容器镜像服务将准备好的本地镜像上传到容器镜像服务（SWR）。使用镜像创建模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ModelArts中常用概念 - AI开发平台ModelArts

指按某种策略由已知判断推出新判断的思维过程。人工智能领域下，由机器模拟人类智能，使用构建的神经网络完成推理过程。在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理批量推理是对批量数据进行推理的批量作业。昇腾芯片昇腾芯片又叫As

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4302。原因分析及处理方法服务预测报错ModelArts.4302有多种场景，以下主要介绍两种场景： "error_msg":

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入模型时，需要支持动态调整租户存储配额；模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

ppCode认证（部署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在线服务部署是否支持包周期？ - AI开发平台ModelArts

在线服务部署是否支持包周期？在线服务不支持包周期的计费模式。父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错问题现象使用CV2包部署在线服务报错。原因分析使用OBS导入元模型，会用到服务侧的标准镜像，标准镜像里面没有CV2依赖的so的内容。所以ModelArts不支持从对象存储服务（OBS）导入CV2模型包。处理方法需要您把CV2包制作为自定

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的访问通道通过公网访问通道的方式访问在线服务通过VPC访问通道的方式访问在线服务通过VPC高速访问通道的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的传输协议使用WebSocket协议的方式访问在线服务使用Server-Sent Events协议的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
访问在线服务支持的认证方式 - AI开发平台ModelArts

访问在线服务支持的认证方式通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

XXX，表示模型中没有导入对应依赖模块。处理方法依赖模块没有导入，需要您在模型推理代码中导入缺失依赖模块。例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError: No module named ‘model_service.tfserving

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在线服务和批量服务有什么区别？ - AI开发平台ModelArts

在线服务和批量服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。批量服务批量服务可对批量数据进行推理，完成数据处理后自动停止。批量服务一次性推理批量数据，处理完服务结束。在线服务提供API接口，供用户调用推理。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

部署服务时，ModelArts报错“ModelArts.3520: 在线服务总数超限，限制为20”，接口返回“A maximum of xxx real-time services are allowed.”，表示服务数量超限。正常情况下，单个用户最多可创建20个在线服务。可采取以下方式处理：删除状态为“异常”的服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

在线服务和边缘服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。边缘服务云端服务是集中化的离终端设备较远，对于实时性要求高的计算需求，把计算放在云上会引起网络延时变长、网络拥塞、服务质量下降等问题。而终端设备通常计算能力不

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常问题现象在部署在线服务时，部署失败。进入在线服务详情页面，“事件”页签，提示“failed to pull image, retry later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口当模型配置文件中定义了具体的端口号，例如：8443，创建AI应用没有配置端口（默认端口号为8080），或者配置了其他端口号，均会导致服务部署失败。您需要把AI应用中的端口号配置为8443，才能保证服务部署成功。修改默认端口号，具体操作如下：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型

总条数： 504

上一页
1
...
5
6
7
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

在线服务部署是否支持包周期？ - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的认证方式 - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在线服务和批量服务有什么区别？ - AI开发平台ModelArts

服务部署失败，报错ModelArts.3520，服务总数超限 - AI开发平台ModelArts

在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

使用自定义镜像创建在线服务，如何修改默认端口 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线