AI开发平台MODELARTS-附录：大模型推理常见问题:问题5：使用AWQ转换llama3.1系列模型权重出现报错

时间：2024-12-17 18:06:49

AI开发平台MODELARTS 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）

问题5：使用AWQ转换llama3.1系列模型权重出现报错

使用AWQ转换llama3.1系列模型权重出现报错：ValueError: 'rope_scaling' must be a dictionary with two fields, 'type' and 'factor'

解决方法：

该问题通过将transformers升级到4.44.0，修改对应transformers中的transformers/models/llama/modeling_llama.py，在class LlamaRotaryEmbedding中的forward函数中增加self.inv_freq = self.inv_freq.npu()

上一篇：AI开发平台MODELARTS-附录：大模型推理常见问题:问题4：使用SmoothQuant进行W8A8进行模型量化时报错

下一篇：AI开发平台MODELARTS-附录：大模型推理常见问题:问题4：使用SmoothQuant进行W8A8进行模型量化时报错

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台MODELARTS-附录：大模型推理常见问题:问题5：使用AWQ转换llama3.1系列模型权重出现报错

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

AI开发平台MODELARTS-附录：大模型推理常见问题:问题5：使用AWQ转换llama3.1系列模型权重出现报错

AI开发平台MODELARTS-附录：大模型推理常见问题:问题5：使用AWQ转换llama3.1系列模型权重出现报错

问题5：使用AWQ转换llama3.1系列模型权重出现报错

7*24

备案

专业服务

退订

建议反馈

售前咨询热线