AI开发平台ModelArts-Ascend-vLLM推理常见问题:问题9：使用benchmark-tools访问推理服务返回报错

时间：2025-02-12 15:14:12

AI开发平台ModelArts

使用benchmark-tools访问推理服务时，输入输出的token和大于max_model_len，服务端返回报错Response payload is not completed，见图2。

再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。

客户端仍返回报错Response payload is not completed，见图4。

图2 服务端返回报错Response payload is not completed

图3 服务端响应200

图4 仍返回报错Response payload is not completed

解决方法：

安装brotlipy后返回正确报错

pip install brotlipy

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台ModelArts-Ascend-vLLM推理常见问题:问题9：使用benchmark-tools访问推理服务返回报错

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

7*24