AI开发平台MODELARTS-训练的权重转换说明:Megatron转HuggingFace参数说明
Megatron转HuggingFace参数说明
如果用户需要自动转换,则在训练作业中,添加变量CONVERT_MG2HF并赋值True。如果用户后续不需要自动转换,则在环境变量中必须删除CONVERT_MG2HF变量。
Megatron转HuggingFace脚本具体参数如下:
- --model-type:模型类型。
- --save-model-type:输出后权重格式。
- --load-dir:训练完成后保存的权重路径。
- --save-dir:需要填入原始HF模型路径,新权重会存于../Llama2-13B/mg2hg下。
- --target-tensor-parallel-size:任务不同调整参数target-tensor-parallel-size,默认为1。
- --target-pipeline-parallel-size :任务不同调整参数target-pipeline-parallel-size,默认为1。
权重转换完成后,需要将转换后的文件与原始Hugging Face模型中的文件进行对比,查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等tokenizer文件或者其他json文件。如果缺少则需要直接复制至权重转换后的文件夹中,否则不能直接用于推理。
- ModelArts计费说明_计费简介_ModelArts怎么计费
- TMS开发_金蝶TMS系统_TMS技术系统_信息化管理_视频
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云
- ModelArts模型训练_创建训练作业_如何创建训练作业
- 华为云内容审核服务_内容审核有什么作用_华为云内容审核的优势
- ModelArts是什么_AI开发平台_ModelArts功能
- ModelArts推理部署_OBS导入_模型包规范-华为云
- AI训练加速存储_高性能数据存储_AI数据存储内存不足怎么办
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts模型训练_超参搜索简介_超参搜索算法