AI开发平台MODELARTS-CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导(6.3.911):步骤四:安装依赖和软件包

时间:2025-01-03 09:38:54

步骤四:安装依赖和软件包

  1. git clone和git lfs下载大模型可以参考如下操作。
    1. 由于欧拉源上没有git-lfs包,所以需要从压缩包中解压使用,在浏览器中输入如下地址下载git-lfs压缩包并上传到容器的/home/ma-user目录下。
      https://github.com/git-lfs/git-lfs/releases/download/v3.2.0/git-lfs-linux-arm64-v3.2.0.tar.gz
      或直接下载到容器,这样在容器中可以直接使用。
      cd /home/ma-user
      wget https://github.com/git-lfs/git-lfs/releases/download/v3.2.0/git-lfs-linux-arm64-v3.2.0.tar.gz
    2. 进入容器,执行安装git lfs命令。
      cd /home/ma-user
      tar -zxvf git-lfs-linux-arm64-v3.2.0.tar.gz 
      cd git-lfs-3.2.0 
      sudo sh install.sh
    3. 设置git配置去掉ssl校验。
      git config --global http.sslVerify false
  2. 从github拉取CogVideoX代码。
    cd /home/ma-user
    git clone https://github.com/THUDM/CogVideo.git
    cd /home/ma-user/CogVideo
    git checkout v1.0
  3. 若进行训练微调需依赖decord和triton包,arm版本可参考附录安装编译。
  4. 安装CogVideo Ascend软件包。
    1. 将获取到的CogVideo Ascend软件包AscendCloud-AIGC-*.zip文件上传到容器的/home/ma-user目录下。获取路径参见获取软件和镜像
    2. 解压AscendCloud-AIGC-*.zip文件,解压后将里面指定文件与对应CogVideo文件进行替换,执行以下命令即可。
      cd /home/ma-user
      unzip AscendCloud-AIGC-*.zip -d ./AscendCloud
      cd AscendCloud/multimodal_algorithm/CogVideo_v1_sft/
      dos2unix install.sh
      bash install.sh

      AscendCloud-AIGC-*.zip后面的*表示时间戳,请按照实际替换。

      CogVideo Ascend软件包内容如下:
      .
      |---- install.sh           安装torch-npu适配修改脚本
      |---- modify.patch         适配CogVideo训练代码git patch文件
      |---- README.md            适配文档基于官方代码commit id说明
      |---- requirements.txt     python依赖包
      |---- vae_cache.py         vae_cache文件
      |---- vae_cache.sh         vae_cache脚本
support.huaweicloud.com/bestpractice-modelarts/modelarts_aigc_cogvideox_911.html