AI开发平台MODELARTS-准备镜像环境:Step4 启动镜像

时间:2024-09-24 10:50:24

Step4 启动镜像

启动容器镜像,fintune全量微调需要启动8卡,启动前可以根据实际需要增加修改参数。
docker run -itd --name ${container_name} -v /sys/fs/cgroup:/sys/fs/cgroup:ro  -v /etc/localtime:/etc/localtime -v /usr/local/Ascend/driver:/usr/local/Ascend/driver -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi --shm-size 60g --device=/dev/davinci_manager --device=/dev/hisi_hdc --device=/dev/devmm_svm --device=/dev/davinci0 --device=/dev/davinci1 --device=/dev/davinci2 --device=/dev/davinci3 --device=/dev/davinci4 --device=/dev/davinci5 --device=/dev/davinci6 --device=/dev/davinci7 --security-opt seccomp=unconfined --network=bridge diffusers-train:0.0.1 bash
启动容器镜像,lora微调和controlnet训练只需要启动单卡,启动前可以根据实际需要增加修改参数。
docker run -itd --name ${container_name} -v /sys/fs/cgroup:/sys/fs/cgroup:ro  -v /etc/localtime:/etc/localtime -v /usr/local/Ascend/driver:/usr/local/Ascend/driver -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi --shm-size 60g --device=/dev/davinci_manager --device=/dev/hisi_hdc --device=/dev/devmm_svm --device=/dev/davinci0  --security-opt seccomp=unconfined --network=bridge diffusers-train:0.0.1 bash

参数说明:

--name ${container_name}:容器名称,进入容器时会用到,此处可以自己定义一个容器名称。

  • --device=/dev/davinci0,..., --device=/dev/davinci7:挂载NPU设备,fintune全量微调示例中挂载了8张卡davinci0~davinci7。
    • driver及npu-smi需同时挂载至容器。
    • 不要将多个容器绑到同一个NPU上,会导致后续的容器无法正常使用NPU功能。
support.huaweicloud.com/bestpractice-modelarts/modelarts_aigc_train_9072.html