搜索_华为云

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

您可以创建一个新的模型版本，选择正确的协议（http或者https），重新部署在线服务或更新已有在线服务。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，报错“ModelArts.4206”。原因分析 ModelArts.4206表示该API的请求流量超过了设定值。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错DL.0105 - AI开发平台ModelArts

在线服务预测报错DL.0105 问题现象在线服务预测报错DL.0105，报错日志：“TypeError:‘float’object is not subscriptable”。原因分析根据报错日志分析，是因为一个float数据被当做对象下标访问了。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4302。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

使用模型部署在线服务登录ModelArts管理控制台，进入“模型部署 >在线服务”页面，单击“部署”，跳转至在线服务部署页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
部署的在线服务状态为告警 - AI开发平台ModelArts

部署的在线服务状态为告警问题现象在部署在线服务时，状态显示为“告警”。解决方法使用状态为告警的服务进行预测，可能存在预测失败的风险，请从以下4个角度进行排查，并重新部署。后台预测请求过多。如果您使用API接口进行预测，请检查是否预测请求过多。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“实例规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“实例数”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
ModelArts在线服务和批量服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务和批量服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。批量服务批量服务可对批量数据进行推理，完成数据处理后自动停止。批量服务一次性推理批量数据，处理完服务结束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
内存不足如何处理？ - AI开发平台ModelArts

处理方法在部署或升级在线服务时，选择更大内存规格的计算节点。图3 选择计算节点规格运行中服务出现告警时，需要分析是您的代码是否出现漏洞导致内存溢出、是否因为业务使用量太大需要更多的内存。如果因业务原因需要更多内存，请升级在线服务选择更大内存规格的计算节点。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found 问题现象部署在线服务出现报错No CUDA runtime is found，using CUDA_HOME='/usr/local/cuda'。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？在线服务将模型部署为一个Web服务，您可以通过管理控制台或者API接口访问在线服务。边缘服务云端服务是集中化的离终端设备较远，对于实时性要求高的计算需求，把计算放在云上会引起网络延时变长、网络拥塞、服务质量下降等问题。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

例如您的模型是Pytorch框架，部署为在线服务时出现告警：ModuleNotFoundError: No module named ‘model_service.tfserving_model_service’，则需要您在推理代码customize_service.py里使用from

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务背景说明目前大模型的参数量已经达到千亿甚至万亿，随之大模型的体积也越来越大。千亿参数大模型的体积超过200G，在版本管理、生产部署上对平台系统产生了新的要求。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错问题现象使用CV2包部署在线服务报错。原因分析使用OBS导入元模型，会用到服务侧的标准镜像，标准镜像里面没有CV2依赖的so的内容。所以ModelArts不支持从对象存储服务（OBS）导入CV2模型包。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

在ModelArts中，支持在部署在线服务时开启AppCode认证（部署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） Qwen-VL是规模视觉语言模型，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 AI Gallery支持将训练的模型或创建的模型资产部署为在线推理服务，可供用户直接调用API完成推理业务。约束限制如果模型的“任务类型”是“文本问答”或“文本生成”，则支持在线推理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster

总条数： 476

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务预测报错ModelArts.4206 - AI开发平台ModelArts

在线服务预测报错DL.0105 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

ModelArts在线服务和批量服务有什么区别？ - AI开发平台ModelArts

内存不足如何处理？ - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线