华为云首页用户手册

AI开发平台MODELARTS-使用MaaS压缩模型:模型压缩时长估算

AI开发平台MODELARTS-使用MaaS压缩模型:模型压缩时长估算

时间：2024-12-25 19:47:59

AI开发平台MODELARTS

模型压缩时长估算

表4 模型压缩时长估算
模型名称	SmoothQuant-W8A8	AWQ-W4A16
Llama2-13B	5~10分钟	60分钟
Llama2-70B	20~30分钟	3小时
Llama2-7B	5~10分钟	40分钟
Llama3-70B	20~30分钟	3小时
Llama3-8B	5~10分钟	40分钟
Qwen1.5-14B	5~10分钟	60分钟
Qwen1.5-72B	20~30分钟	3小时
Qwen1.5-7B	5~10分钟	40分钟
Qwen2-72B	20~30分钟	-
Qwen2-72B-1K	20~30分钟	-
Qwen2.5-72B	40分钟	-
Qwen2.5-32B	20~30分钟	2小时

上一篇：AI开发平台MODELARTS-使用MaaS压缩模型:创建压缩作业

下一篇：AI开发平台MODELARTS-使用MaaS压缩模型:创建压缩作业

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台MODELARTS-使用MaaS压缩模型:模型压缩时长估算

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题