AI开发平台MODELARTS-训练权重转换说明:用户自定义执行权重转换参数修改说明
用户自定义执行权重转换参数修改说明
若用户要自定义数据处理脚本并且单独执行,同样以 llama2 为例。注意脚本中的python命令分别有Hugging Face 转 Megatron格式,以及Megatron 转 Hugging Face格式,而脚本使用hf2hg、mg2hf参数传递来区分。
- 方法一:用户可打开scripts/llama2/2_convert_mg_hf.sh脚本,将执行的python命令复制下来,修改环境变量的值。在Notebook进入到 /home/ma-user/work/llm_train/AscendSpeed/ModelLink 路径中,再执行python命令。
- 方法二:用户在Notebook直接编辑scripts/llama2/2_convert_mg_hf.sh脚本,自定义环境变量的值,并在脚本的首行中添加 cd /home/ma-user/work/llm_train/AscendSpeed/ModelLink 命令,随后在Notebook中运行该脚本。
其中环境变量详细介绍如下:
参数 |
示例 |
参数说明 |
---|---|---|
$1 |
hf2hg、mg2hf |
运行 2_convert_mg_hf.sh 时,需要附加的参数值。如下: hf2hg:用于Hugging Face 转 Megatron mg2hf:用于Megatron 转 Hugging Face |
TP |
8 |
张量并行数,一般等于单机卡数 |
PP |
1 |
流水线并行数,一般等于节点数量 |
ORIGINAL_HF_WEIGHT |
/home/ma-user/work/model/Llama2-13B |
原始Hugging Face模型路径 |
CONVERT_MODEL_PATH |
/home/ma-user/work/llm_train/processed_for_ma_input/llama2-13b/converted_weights_TP8PP1 |
权重转换完成之后保存路径 |
TOKENIZER_PATH |
/home/ma-user/work/model/llama-2-13b-chat-hf |
tokenizer路径,即:原始Hugging Face模型路径 |
MODEL_SAVE_PATH |
/home/ma-user/work/llm_train/saved_dir_for_output/llama2-13b |
训练完成后保存的权重路径。 |