AI开发平台MODELARTS-使用MaaS压缩模型:模型压缩时长估算
模型压缩时长估算
模型名称 |
SmoothQuant-W8A8 |
AWQ-W4A16 |
---|---|---|
Llama2-13B |
5~10分钟 |
60分钟 |
Llama2-70B |
20~30分钟 |
3小时 |
Llama2-7B |
5~10分钟 |
40分钟 |
Llama3-70B |
20~30分钟 |
3小时 |
Llama3-8B |
5~10分钟 |
40分钟 |
Qwen1.5-14B |
5~10分钟 |
60分钟 |
Qwen1.5-72B |
20~30分钟 |
3小时 |
Qwen1.5-7B |
5~10分钟 |
40分钟 |
Qwen2-72B |
20~30分钟 |
- |
Qwen2-72B-1K |
20~30分钟 |
- |
Qwen2.5-72B |
40分钟 |
- |
Qwen2.5-32B |
20~30分钟 |
2小时 |
- ModelArts模型训练_模型训练简介_如何训练模型
- 什么是数字人_数字人真人声音录制_华为云1
- GaussDB数据库模型_GaussDB是什么_高斯数据库模型
- ModelArts计费说明_计费简介_ModelArts怎么计费
- 华为云盘古大模型_华为云AI大模型_盘古人工智能
- TMS可视化分析_网管系统TMS_TMS平台_智能制造
- TMS开发_金蝶TMS系统_TMS技术系统_信息化管理_视频
- 时序数据库_云数据库GeminiDB Influx接口
- 免费时序数据库_时序数据库influxdb场景_数据库资源免费领取_实时数据库
- 云数据库RDS for MySQL数据备份_备份策略_自动备份_手动备份