AI开发平台MODELARTS-eagle投机小模型训练:步骤五:训练生成权重转换成可以支持vLLM推理的格式
步骤五:训练生成权重转换成可以支持vLLM推理的格式
将训练完成后的权重文件(.bin文件或. safetensors文件),移动到下载好的开源权重目录下(即步骤4中,config文件所在目录)。
python convert_eagle_ckpt_to_vllm_compatible.py --base-path 大模型权重地址 --draft-path 小模型权重地址 --base-weight-name 大模型包含lm_head的权重文件名 --draft-weight-name 小模型权重文件名
--base-path:为大模型权重地址,例如 ./llama2-7b-chat
--draft-path:小模型权重地址 即步骤四中config文件所在目录,例如 ./eagle_llama2-7b-chat
--base-weight-name:为大模型包含lm_head的权重文件名,可以在 base-path 目录下的 model.safetensors.index.json 文件获取,例如llama2-7b-chat 的权重名为pytorch_model-00001-of-00002.bin
--draft-weight-name 为小模型权重文件名,即刚才移动的.bin文件或者.safetensors 文件
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts推理部署_模型_AI应用来源-华为云
- ModelArts是什么_AI开发平台_ModelArts功能
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云
- TMS开发_金蝶TMS系统_TMS技术系统_信息化管理_视频
- ModelArts计费说明_计费简介_ModelArts怎么计费
- ModelArts模型训练_超参搜索简介_超参搜索算法
- ModelArts推理部署_AI应用_部署服务-华为云
- ModelArts自动学习是什么_自动学习简介_零代码完成AI开发