搜索_华为云

实时推理的部署及使用流程 - AI开发平台ModelArts

实时推理的部署及使用流程在创建完模型后，可以将模型部署为一个在线服务。当在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功的在线服务，将为用户提供一个可调用的API，此API为标准Restful API。访问在线服务时，您可以根据您的业务需求，分别确认使用何种认证方式、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
推理性能测试 - AI开发平台ModelArts

--url：API接口公网地址与"/v1/completions"拼接而成，部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

模型镜像。服务运维阶段，先利用镜像构建模型，接着部署模型为在线服务，然后可在云监控服务（CES）中获得ModelArts推理在线服务的监控数据，最后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
推理部署使用场景 - AI开发平台ModelArts

部署服务：模型构建完成后，根据您的业务场景，选择将模型部署成对应的服务类型。将模型部署为实时推理作业将模型部署为一个Web Service，并且提供在线的测试UI与监控功能，部署成功的在线服务，将为用户提供一个可调用的API。将模型部署为批量推理服务批量服务可对批量数据进行推理，完成数据处理后自动停止。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
推理精度测试 - AI开发平台ModelArts

1:${port}/v1/completions"；若服务部署在生产环境中，该地址由API接口公网地址与"/v1/completions"拼接而成，部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 few_shot：开启少量样本测试后添加示例样本的个数。默认为3，取值范围为0~5整数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ModelArts最佳实践案例列表 - AI开发平台ModelArts

delArts平台上进行训练。镜像中使用的AI引擎是PyTorch，训练使用的资源是CPU或GPU。从0制作自定义镜像并用于训练（MPI+CPU/GPU） MPI 镜像制作自定义镜像训练 - 此案例介绍如何从0到1制作镜像，并使用该镜像在ModelArts平台上进行训练。镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

tor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环境规格（如CPU规格，GPU规格）由表3 predictor configs结构决定。部署在线服务Predictor需要线上服务端根据A

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
部署声音分类服务 - AI开发平台ModelArts

调用接口访问在线服务。表1 预测结果中的参数说明参数说明 predicted_label 该段音频的预测类别。 score 预测为此类别的置信度。由于“运行中”的在线服务将持续耗费资源，如果不需再使用此在线服务，建议在版本管理区域，单击“停止”，即可停止在线服务的部署，避

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

CMKFullAccess 虚拟私有云服务VPC VPC FullAccess AI开发平台ModelArts ModelArts CommonOperations ModelArts Dependency Access 模型管理/在线服务/批量服务/边缘服务/边缘部署专属资源池对象存储服务OBS OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

答仅“华东二”和“西南-贵阳一”区域支持使用ModelArts Studio大模型即服务平台（MaaS）。场景描述本案例用于指导用户使用ModelArts Studio大模型即服务平台（下面简称为MaaS）的DeepSeek-R1模型框架，快速实现对话问答。更多MaaS服务的使用指导，请参见用户指南。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

示模型可以使用。步骤三：使用订阅模型部署在线服务模型订阅成功后，可将此模型部署为在线服务在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值，此处以“商超商品识别服务”为例。

帮助中心 > AI开发平台ModelArts > 快速入门
查询服务详情 - AI开发平台ModelArts

服务当前运行所用配置的更新时间，距“1970.1.1 0:0:0 UTC”的毫秒数。 debug_url String 在线服务在线调试地址，只有当模型支持在线调试且只有一个实例的时候会存在。 due_time Number 在线服务自动停止时间，距“1970.1.1 0:0:0 UTC”的毫秒数，未配置自动停止则不返回。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
部署物体检测服务 - AI开发平台ModelArts

detection_scores 每个检测框的置信度。图2 检测框的四点坐标示意图由于“运行中”的在线服务将持续耗费资源，如果不需再使用此在线服务，建议在版本管理区域，单击“停止”，即可停止在线服务的部署，避免产生不必要的费用。如果需要继续使用此服务，可单击“启动”恢复。如果您启用了

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
部署文本分类服务 - AI开发平台ModelArts

调用接口访问在线服务。表1 预测结果中的参数说明参数说明 predicted_label 该段文本的预测类别。 score 预测为此类别的置信度。由于“运行中”的在线服务将持续耗费资源，如果不需再使用此在线服务，建议在版本管理区域，单击“停止”，即可停止在线服务的部署，避

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
推理部署计费项 - AI开发平台ModelArts

规则。综上，在线服务的运行费用 = 计算资源费用（3.50 元） + 存储费用示例：使用专属资源池。计费项：存储费用假设用户于2023年4月1日10:00:00创建了一个使用专属资源池的在线服务，并在11:00:00停止运行。按照存储费用结算，那么运行这个在线服务的费用计算过程如下：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

查项出现故障时，隔离故障硬件并重新下发训练作业。针对于分布式场景，容错检查会检查本次训练作业的全部计算节点。推理部署故障恢复用户部署的在线推理服务运行过程中，如发生硬件故障导致推理实例故障，ModelArts会自动检测到并迁移受影响实例到其它可用节点，实例启动后恢复推理请求处

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

单击操作列“部署>在线服务”，将模型部署为在线服务。图6 部署在线服务在“部署”页面，参考下图填写参数，然后根据界面提示完成在线服务创建。本案例适用于CPU规格，节点规格需选择CPU。如果有免费CPU规格，可选择免费规格进行部署（每名用户限部署一个免费的在线服务，如果您已经部

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练

总条数： 2651

上一页
1
...
6
7
8
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时推理的部署及使用流程 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

部署声音分类服务 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

部署物体检测服务 - AI开发平台ModelArts

部署文本分类服务 - AI开发平台ModelArts

推理部署计费项 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线