搜索_华为云

使用MaaS部署模型服务 - AI开发平台ModelArts

实例数设置服务器个数。推荐实例数 = 流量限制 ÷ 推荐的单实例流量限制推荐的单实例流量限制请参见单实例QPS的推荐值说明。更多选项内容审核选择是否打开内容审核，默认启用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理通过patch操作对服务进行更新查询服务监控信息查询服务列表部署服务查询支持的服务部署规格查询服务详情更新服务配置删除服务更新模型服务的单个属性查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签

 帮助中心 > AI开发平台ModelArts > API参考
ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？ - AI开发平台ModelArts

在同一区域，ModelArts通过OBS的API访问OBS中的文件属于内网通信，不消耗公网流量费。如果是通过互联网从OBS下载数据到本地，这时候会产生OBS公网流量费。OBS的详细计费说明可以参见计费项。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
在线服务预测报错MR.0105 - AI开发平台ModelArts

父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
查询服务更新日志 - AI开发平台ModelArts

权重百分比，分配到此模型的流量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
启动推理服务 - AI开发平台ModelArts

服务启动命令中的参数设置请参见启动在线推理服务。通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker_ip}替换为实际宿主机的IP地址。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
部署推理服务 - AI开发平台ModelArts

方式一：通过OpenAI服务API接口启动服务在llm_inference/ascend_vllm/目录下通OpenAI服务API接口启动服务，具体操作命令如下，可以根据参数说明修改配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

建议您检查模型返回结果，处理模型报错问题，可尝试通过调整请求参数、降低请求流量等方式，提高模型调用的成功率。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
推理服务测试 - AI开发平台ModelArts

父主题：服务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
服务启动失败 - AI开发平台ModelArts

拉取镜像失败服务启动失败，提示拉取镜像失败，请参考服务部署、启动、升级和修改时，拉取镜像失败如何处理？资源不足，服务调度失败服务启动失败，提示资源不足，服务调度失败，请参考服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
升级模型服务 - AI开发平台ModelArts

在目标模型服务右侧，单击操作列的“更多 > 服务升级”。在“服务升级”页面，配置升级参数。 “模型设置”：选择原模型下的其他模型版本。其他参数不可修改，但可以了解原模型服务的配置。配置完成后，单击“提交”启动服务升级。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

服务部署失败，报错No Module named XXX 问题现象服务部署失败，报错：No Module named XXX 原因分析 No Module named XXX，表示模型中没有导入对应依赖模块。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查看在线服务详情 - AI开发平台ModelArts

个性化配置您可以为在线服务的不同版本设定不同配置条件，并支持携带自定义运行参数，丰富版本分流策略或同一版本内的不同运行配置。您可以打开个性化配置按钮，单击“查看配置”修改服务个性化配置。服务流量限制服务流量限制是指每秒内一个服务能够被访问的次数上限。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
ModelArts在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

ModelArts在线服务的API接口组成规则是什么？模型部署成在线服务后，用户可以获取API接口用于访问推理。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）

总条数： 1460

上一页
1
2
3
4
5
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用MaaS部署模型服务 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？ - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

ModelArts在线服务的API接口组成规则是什么？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线