搜索_华为云

ModelArts在线服务和批量服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务和批量服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。批量服务批量服务可对批量数据进行推理，完成数据处理后自动停止。批量服务一次性推理批量数据，处理完服务结束。在线服务提供API接口，供用户调用推理。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“实例规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“实例数”。如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。原因分析从日志报错信息No CUDA runtime is

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。例如：导入模型时，需要支持动态调整租户存储配额；模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

ModelArts支持通过JupyterLab工具在线打开Notebook，开发基于PyTorch、TensorFlow和MindSpore引擎的AI模型。具体操作流程如图1 使用JupyterLab在线开发调试代码所示。图1 使用JupyterLab在线开发调试代码操作步骤创建Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。访问在线服务公网访问在线服务有以下认证方式，API调用请参见认证详情：通过Token认证的方式访问在线服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错问题现象使用CV2包部署在线服务报错。原因分析使用OBS导入元模型，会用到服务侧的标准镜像，标准镜像里面没有CV2依赖的so的内容。所以ModelArts不支持从对象存储服务（OBS）导入CV2模型包。处理方法需要您把CV2包制作为自定

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

ppCode认证（部署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

单击“确定”，完成DNS内网域名的创建。 VPC访问在线服务通过VPC访问通道访问在线服务，API如下： https://{DNS内网域名}/{URL} DNS内网域名：设置的内网域名。您还可以通过在线服务列表页，单击“VPC访问通道”，打开弹出框，查看“访问域名”。 URL：在线服务的URL为服务详情页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

开启支持APP认证功能在部署为在线服务时，您可以开启支持APP认证功能。或者针对已部署完成的在线服务，您可以修改服务，开启支持APP认证功能。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署 > 在线服务”，进入在线服务管理页面。开启支持APP认证功能。在部署为在线服务时，即“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

定”跳转至在线推理服务列表页面。当“状态”变为“运行中”表示在线推理服务部署成功，可以进行服务预测。推理服务预测待在线推理服务状态变为“运行中”时，便可进行推理预测。在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”，在测试页面根据任务类型以及页面提示完成对应的测试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务如果在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功的在线服务，将为用户提供一个可调用的API，此API为标准Restful API。在集成至生产环境之前，需要对此API进行调测，您可以使用以下方式向在线服务发起预测请求：方式一

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

向数据传输。前提条件在线服务部署时需选择“升级为WebSocket”。在线服务中的模型导入选择的镜像需支持WebSocket协议。约束与限制 WebSocket协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。边缘服务云端服务是集中化的离终端设备较远，对于实时性要求高的计算需求，把计算放在云上会引起网络延时变长、网络拥塞、服务质量下降等问题。而终端

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。只有专属资源池部署的服务才支持VPC直连的高速访问通道。 VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

根据提示完成身份验证，下载密钥，并妥善保管。获取在线服务信息在调用接口时，需获取在线服务的调用地址，以及在线服务的输入参数信息。步骤如下：登录ModelArts管理控制台，在左侧导航栏中选择“模型部署 > 在线服务”，默认进入“在线服务”列表。单击目标服务名称，进入服务详情页面。在“在线服务”的详情页面

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
部署模型为在线服务 - AI开发平台ModelArts

情况。在线服务列表中，刚部署的服务“状态”为“部署中”，当在线服务的“状态”变为“运行中”时，表示服务部署完成。使用预测功能测试在线服务模型部署为在线服务成功后，您可以在“预测”页签进行代码调试或添加文件测试。根据模型定义的输入请求不同（JSON文本或文件），测试服务包括如下两种方式：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常问题现象在部署在线服务时，部署失败。进入在线服务详情页面，“事件”页签，提示“failed to pull image, retry later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

Socket（双向实时），它更加轻量级且易于实现。前提条件在线服务中的模型导入选择的镜像需支持SSE协议。约束与限制 SSE协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议

总条数： 2660

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts在线服务和批量服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

通过公网访问通道的方式访问在线服务 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

使用Server-Sent Events协议的方式访问在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线