AI开发平台MODELARTS-附录:训练常见问题:问题5:训练完成使用vllm0.6.0框架推理失败:
问题5:训练完成使用vllm0.6.0框架推理失败:
错误截图:
报错原因:
训练时transformers版本要求为4.45.0,训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串,导致推理异常
解决措施,以下两种方法任选其一:
①更新transformes和tokenizers版本
- GLM4-9B模型,容器内执行以下步骤:
pip install transformers==4.43.2
- 其它模型,容器内执行以下步骤:
pip install transformers==4.45.0 pip install tokenizers==0.20.0
②使用原始hf权重的tokenizer.json覆盖保存的tokenizer.json即可,如llama3-8b_lora具体过程如下:
# 进入模型tokenizer目录 cd /home/ma-user/ws/tokenizers/llama3-8b/ # 替换tokenizer.json文件 cp -f tokenizer.json /home/ma-user/ws/saves/rm/llama3-8b/lora/tokenizer.json
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts是什么_AI开发平台_ModelArts功能
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts推理部署_AI应用_部署服务-华为云
- ModelArts计费说明_计费简介_ModelArts怎么计费
- ModelArts自定义镜像_自定义镜像简介_如何使用自定义镜像
- TMS开发_金蝶TMS系统_TMS技术系统_信息化管理_视频
- ModelArts自动学习是什么_自动学习简介_零代码完成AI开发
- 华为云内容审核服务_内容审核有什么作用_华为云内容审核的优势
- ModelArts分布式训练_分布式训练介绍_分布式调测