AI开发平台MODELARTS-训练的权重转换说明:Megatron转HuggingFace参数说明
Megatron转HuggingFace参数说明
训练完成的权重文件默认不会自动转换为Hugging Face格式权重。若用户需要自动转换,则在运行脚本,例如0_pl_pretrain_13b.sh中,添加变量CONVERT_MG2HF并赋值TRUE。若用户后续不需要自动转换,则在运行脚本中必须删除CONVERT_MG2HF变量。
Megatron转HuggingFace脚本具体参数如下:
- --model-type:模型类型。
- --save-model-type:输出后权重格式。
- --load-dir:训练完成后保存的权重路径。
- --save-dir:需要填入原始HF模型路径,新权重会存于../Llama2-13B/mg2hg下。
- --target-tensor-parallel-size:任务不同调整参数target-tensor-parallel-size,默认为1。
- --target-pipeline-parallel-size :任务不同调整参数target-pipeline-parallel-size,默认为1。
输出转换后权重文件保存路径:
权重转换完成后,在/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b/saved_models/pretrain_hf/目录下查看转换后的权重文件。
注意:权重转换完成后,需要将例如saved_models/pretrain_hf中的文件与原始Hugging Face模型中的文件进行对比,查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中,否则不能直接用于推理。
- ModelArts计费说明_计费简介_ModelArts怎么计费
- TMS开发_金蝶TMS系统_TMS技术系统_信息化管理_视频
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云
- 华为云内容审核服务_内容审核有什么作用_华为云内容审核的优势
- ModelArts是什么_AI开发平台_ModelArts功能
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts推理部署_OBS导入_模型包规范-华为云
- AI训练加速存储_高性能数据存储_AI数据存储内存不足怎么办
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts模型训练_超参搜索简介_超参搜索算法