AI开发平台MODELARTS-模型NPU卡数取值表

时间：2025-01-24 14:45:07

AI开发平台MODELARTS

模型NPU卡数取值表

不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推

表1 模型NPU卡数取值表
支持模型	支持模型参数量	文本序列长度	训练类型	Zero并行	规格与节点数
llama3	70B	cutoff_len=4096	lora	per_device_train_batch_size=1	2节点 & 8Ascend
		cutoff_len=4096	sft	per_device_train_batch_size=1	8节点 & 8Ascend
		cutoff_len=8192	lora	per_device_train_batch_size=1	2节点 & 8Ascend
		cutoff_len=8192	sft	per_device_train_batch_size=1	8节点 & 8Ascend
	8B	cutoff_len=4096/8192	lora sft	per_device_train_batch_size=1	1节点 & 1Ascend 1节点 & 4Ascend
Qwen2	72B	cutoff_len=4096	lora sft	per_device_train_batch_size=1	2节点 & 8Ascend 4节点 & 8Ascend
	72B	cutoff_len=8192	lora sft	per_device_train_batch_size=1	2节点 & 8Ascend 8节点 & 8Ascend
	7B	cutoff_len=4096	lora/sft	per_device_train_batch_size=1	1节点 & 4Ascend
	7B	cutoff_len=8192	lora/sft	per_device_train_batch_size=1	1节点 & 8Ascend
	0.5/1.5B	cutoff_len=4096/8192	lora/sft	per_device_train_batch_size=1	1节点 & 1Ascend
Qwen1.5	0.5B/1.8B	cutoff_len=4096/8192	lora/sft	per_device_train_batch_size=1	1节点 & 1Ascend
	4B	cutoff_len=4096/8192	sft	per_device_train_batch_size=1	1节点 & 4Ascend
	4B	cutoff_len=4096/8192	lora	per_device_train_batch_size=1	1节点 & 1Ascend
	7B	cutoff_len=4096/8192	lora	per_device_train_batch_size=1	1节点 & 1Ascend
	7B	cutoff_len=4096/8192	sft	per_device_train_batch_size=1	1节点 & 8Ascend
	14B	cutoff_len=4096/8192	sft	per_device_train_batch_size=1	1节点 & 8Ascend
	14B	cutoff_len=4096/8192	lora	per_device_train_batch_size=1	1节点 & 1Ascend
falcon2	11B	cutoff_len=4096/8192	sft	per_device_train_batch_size=1	1节点 & 8Ascend
falcon2	11B	cutoff_len=4096/8192	lora	per_device_train_batch_size=1	1节点 & 1Ascend
Yi	6B	cutoff_len=4096/8192	sft	per_device_train_batch_size=1	1节点 & 4Ascend
	6B	cutoff_len=4096/8192	lora	per_device_train_batch_size=1	1节点 & 1Ascend
	34B	cutoff_len=4096	sft lora	per_device_train_batch_size=1	2节点 & 8Ascend 1节点 & 2Ascend
	34B	cutoff_len=8192	sft lora	per_device_train_batch_size=1	2节点 & 8Ascend 1节点 & 4Ascend