AI开发平台MODELARTS-附录:训练常见问题:问题5:训练完成使用vllm0.6.0框架推理失败:

时间:2024-11-12 16:42:44

问题5:训练完成使用vllm0.6.0框架推理失败:

错误截图:

报错原因:

训练时transformers版本要求为4.45.0,训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串,导致推理异常

解决措施,以下两种方法任选其一:

①更新transformes和tokenizers版本

  • GLM4-9B模型,容器内执行以下步骤:
    pip install transformers==4.43.2
  • 其它模型,容器内执行以下步骤:
    pip install transformers==4.45.0
    pip install tokenizers==0.20.0

②使用原始hf权重的tokenizer.json覆盖保存的tokenizer.json即可,如llama3-8b_lora具体过程如下:

# 进入模型tokenizer目录
cd /home/ma-user/ws/tokenizers/llama3-8b/
# 替换tokenizer.json文件
cp -f tokenizer.json /home/ma-user/ws/saves/rm/llama3-8b/lora/tokenizer.json
support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_train_90936.html