AI开发平台MODELARTS-训练中的权重转换说明:Megatron转HuggingFace参数说明

时间:2024-09-24 10:50:19

Megatron转HuggingFace参数说明

训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换,则在运行脚本,例如0_pl_pretrain_13b.sh中,添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换,则在运行脚本中必须删除CONVERT_MG2HF变量。

Megatron转HuggingFace脚本具体参数如下:

  • --model-type:模型类型。
  • --save-model-type:输出后权重格式。
  • --load-dir:训练完成后保存的权重路径。
  • --save-dir:需要填入原始HF模型路径,新权重会存于../Llama2-13B/mg2hg下。
  • --target-tensor-parallel-size:任务不同调整参数target-tensor-parallel-size,默认为1。
  • --target-pipeline-parallel-size :任务不同调整参数target-pipeline-parallel-size,默认为1。

输出转换后权重文件保存路径:

权重转换完成后,在 /home/ma-user/ws/saved_dir_for_output/llama2-13b/saved_models/pretrain_hf/ 目录下查看转换后的权重文件。

support.huaweicloud.com/bestpractice-modelarts/modelarts_10_3110.html