搜索_华为云

启动推理服务 - AI开发平台ModelArts

=ray】，其他参数与正常启服务一致即可。具体参考本文单机场景下OpenAI服务的API接口启动在线推理服务方式。推理请求测试使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见启动在线推理服务。通过OpenAI服务API接口启动服务使用以下推理测试命令。${d

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

结果的准确性。步骤5：清理资源体验结束后，建议暂停或删除服务，避免占用资源，造成资源浪费。停止在线服务：在“在线服务”列表，单击对应服务操作列的“更多 > 停止”。删除在线服务：在“在线服务”列表，单击对应服务操作列的“更多 > 删除”。父主题：历史待下线案例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
查看ModelArts模型详情 - AI开发平台ModelArts

模型的描述。操作部署：将模型发布为在线服务、批量服务或边缘服务。创建新版本：创建新的模型版本。参数配置除版本外，将默认选择上一个版本的配置信息，您可以对参数配置进行修改。删除：删除对应的模型。说明：如果模型的版本已经部署服务，需先删除关联的服务后再执行删除操作。模型删除后不可恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
ModelArts入门指引 - AI开发平台ModelArts

ModelArts入门指引本文旨在帮助您了解ModelArts的基本使用流程以及相关的常见问题，帮助您快速上手ModelArts服务。面向不同AI基础的开发者，本文档提供了相应的入门教程，帮助用户更快速地了解ModelArts的功能，您可以根据经验选择相应的教程。面向AI开

 帮助中心 > AI开发平台ModelArts > 快速入门
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

表12 服务管理接口 API 说明部署服务部署服务。查询服务列表查询服务列表。查询服务详情查询服务详情，根据服务ID查询服务详情。启动停止边缘节点服务实例启动停止边缘节点服务实例。更新服务配置更新模型服务。查询服务监控信息查询服务监控信息。查询服务更新日志

 帮助中心 > AI开发平台ModelArts > API参考
自定义镜像规范 - AI开发平台ModelArts

Gallery在线推理服务部署模型。如果使用自定义镜像进行训练，操作步骤可以参考使用AI Gallery微调大师训练模型，其中“训练任务类型”默认选择“自定义”，且不支持修改。如果使用自定义镜像进行部署推理服务，操作步骤可以参考使用AI Gallery在线推理服务部署模型，其中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
在Workflow中更新已部署的服务 - AI开发平台ModelArts

入，一个是模型列表对象，另一个是在线服务对象，此时在运行态通过开关的方式来控制部署/更新服务，如下图所示：在线服务开关默认关闭，节点走部署服务的流程；如果需要更新服务，则手动打开开关，选择相应的在线服务即可。进行服务更新时，需要保证被更新的服务所使用的模型与配置的模型名称相同。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

ModelArts服务软件开发工具包（ModelArts SDK）是对ModelArts服务提供的REST API进行的Python封装，以简化用户的开发工作。用户直接调用ModelArts SDK即可轻松管理数据集、启动AI训练以及生成模型并将其部署为在线服务。 ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

可以在创建训练作业页面添加标签，也可以在已经创建完成的训练作业详情页面的“标签”页签中添加标签。在ModelArts的在线服务中添加标签。可以在创建在线服务页面添加标签，也可以在已经创建完成的在线服务详情页面的“标签”页签中添加标签。在ModelArts的专属资源池中添加标签。可以在创建ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
在MaaS体验模型服务 - AI开发平台ModelArts

在MaaS体验模型服务在ModelArts Studio大模型即服务平台，运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。前提条件使用预置服务：在“模型推理”页面的“预置服务”页签，已领取免费Token额度且额度未使用完毕，或者已开通付费服务。具体操作，请参见免费体验MaaS预置服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
自定义模型规范 - AI开发平台ModelArts

托管其他任务类型的模型，其他任务类型的模型被称为自定义模型。但是托管的自定义模型要满足规范才支持使用AI Gallery工具链服务（微调大师、在线推理服务）。自定义模型的使用流程托管模型到AI Gallery。模型基础设置里的“任务类型”选择除“文本问答”和“文本生成”之外的类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
在推理生产环境中部署推理服务 - AI开发平台ModelArts

分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图3 部署在线服务单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图4 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”，设置请求路径：“/genera

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制，每个主账号租户调用次数不超过2000次/分钟，每个子账号租户不超过20次/分钟。目前仅支持自定义镜像导入模型，部署的服务支持高速访问通道。操作步骤使用VPC直连的高速访问通道访问在线服务，基本操作步骤如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
服务状态一直处于“部署中” - AI开发平台ModelArts

应的端口号，使新的模型重新部署服务。如何修改默认端口号，请参考使用自定义镜像创建在线服务，如何修改默认端口。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

s定义”修改模型的配置信息。 “部署类型” 选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。 “启动命令” 选填参数，指定模型的启动命令，您可以自定义该命令。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

ModelArts SDK目前仅支持在ModelArts开发环境Notebook和本地PC两种环境使用。 ModelArts SDK不支持在训练作业和在线服务中使用。 ModelArts SDK已经集成在ModelArts开发环境Notebook中，可以直接使用，无需进行Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
在推理生产环境中部署推理服务 - AI开发平台ModelArts

细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/g

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
模型训练计费项 - AI开发平台ModelArts

事件通知（不开启则不计费）订阅消息使用消息通知服务，在事件列表中选择特定事件，在事件发生时发送消息通知。如果想使用消息通知，需要在创建训练作业时开启“事件通知”功能。具体计费可见消息通知服务价格详情。按实际用量付费发送短信通知费用构成：短信通知条数发送电子邮件费用构成：电子邮件+外网下行流量

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在推理生产环境中部署推理服务 - AI开发平台ModelArts

细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/g

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 1659

上一页
1
...
6
7
8
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动推理服务 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

服务状态一直处于“部署中” - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

模型训练计费项 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线