AI开发平台MODELARTS-模型NPU卡数、梯度累积值取值表

时间：2025-03-12 09:40:39

AI开发平台MODELARTS

模型NPU卡数、梯度累积值取值表

不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。

表1 NPU卡数、加速框架、梯度配置取值表
模型	Template	模型参数量	训练策略类型	序列长度cutoff_len	梯度累积值	优化工具(Deepspeed)	规格与节点数
llama2	llama2	7B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
		7B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
		13B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 1Ascend
		13B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 8Ascend
		70B	lora	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-3-Offload	2节点 & 8Ascend
			full	4096/8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	4节点 & 8Ascend
llama3	llama3	70B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
		70B	full	4096/8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	4节点 & 8Ascend
		8B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 1Ascend
		8B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
llama3.1	llama3	8B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
		8B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
		70B	lora	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-3-Offload	2节点 & 8Ascend
			full	4096/8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	4节点 & 8Ascend
Qwen2	qwen	72B	lora	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-3-Offload	2节点 & 8Ascend
			full	4096/8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	4节点 & 8Ascend
		7B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 1Ascend
		7B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
		0.5/1.5B	lora/full	4096/8192	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 1Ascend
Qwen2_vl	qwen2_vl	2B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 1Ascend
		2B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 2Ascend
		7B	lora	4096	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 1Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
			full	4096	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
			full	8192	gradient_accumulation_steps: 8	ZeRO-2-Offload	1节点 & 8Ascend
Qwen1.5	qwen	0.5/1.8B	lora/full	4096/8192	gradient_accumulation_steps: 8	ZeRO-0	1节点 & 1Ascend
		4B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
		4B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 4Ascend
		7B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
		7B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
		14B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 1Ascend
		14B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 8Ascend
		32B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 4Ascend
			full	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			full	8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	2节点 & 8Ascend
		72B	lora	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-3-Offload	2节点 & 8Ascend
			full	4096/8192	gradient_accumulation_steps: 4	ZeRO-3-Offload	4节点 & 8Ascend
falcon2	falcon	11B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 1Ascend
falcon2	falcon	11B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 8Ascend
GLM4	glm4	9B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-2	1节点 & 1Ascend
GLM4	glm4	9B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 8Ascend
Yi	yi	6B	lora	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 1Ascend
		6B	full	4096/8192	gradient_accumulation_steps: 8	ZeRO-1	1节点 & 4Ascend
		34B	full	4096	gradient_accumulation_steps: 8	ZeRO-3	2节点 & 8Ascend
			lora	4096	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 2Ascend
			full	8192	gradient_accumulation_steps: 8	ZeRO-3	4节点 & 8Ascend
			lora	8192	gradient_accumulation_steps: 8	ZeRO-3	1节点 & 4Ascend