华为云首页用户手册

AI开发平台MODELARTS-部署的在线服务状态为告警:解决方法

AI开发平台MODELARTS-部署的在线服务状态为告警:解决方法

时间：2024-11-22 17:40:39

AI开发平台MODELARTS

解决方法

使用状态为告警的服务进行预测，可能存在预测失败的风险，请从以下4个角度进行排查，并重新部署。

后台预测请求过多。
如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。
业务内存不正常。
请检查推理代码是否存在内存溢出或者内存泄漏的问题。
模型运行异常。
请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。
实例pod数量异常。
如果您曾经找过运维人员删除过异常的实例pod，事件中可能会出现告警“服务异常，不正常的实例数为XXX”。在出现这种告警后，服务会自动拉起新的正常实例，从而恢复到正常运行状态。请您耐心等待。

上一篇：AI开发平台MODELARTS-训练作业进程异常退出:原因分析

下一篇：AI开发平台MODELARTS-模型发布失败

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台MODELARTS-部署的在线服务状态为告警:解决方法

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题