华为云首页用户手册

AI开发平台MODELARTS-推理性能测试:约束限制

AI开发平台MODELARTS-推理性能测试:约束限制

时间：2024-12-09 20:36:21

AI开发平台MODELARTS

约束限制

创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。
同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。

上一篇：AI开发平台MODELARTS-推理性能测试:静态benchmark

下一篇：AI开发平台MODELARTS-推理精度测试:Step1 配置精度测试环境

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台MODELARTS-推理性能测试:约束限制

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题