AI开发平台MODELARTS-MiniCPM-V2.6基于DevServer适配PyTorch NPU训练指导(6.3.909):Step4 安装依赖和软件包

时间:2024-11-15 09:44:20

Step4 安装依赖和软件包

  1. 从github拉取MiniCPM-V代码。
    cd /home/ma-user
    git clone https://github.com/OpenBMB/MiniCPM-V.git
    cd /home/ma-user/MiniCPM-V
    git checkout c541f1044e7c0bb2ba48e3eb21daf070e90cd6a2
  2. 获取openbmb/MiniCPM-V-2_6模型。
    https://huggingface.co/openbmb/MiniCPM-V-2_6
    #手动下载模型权重放置在指定路径
    sudo chown -R ma-user:ma-group ${container_work_dir}
    mkdir -p ${container_work_dir}/minicpm/MiniCPM-V-2_6/ 
    cp -r MiniCPM-V-2_6 ${container_work_dir}/minicpm/MiniCPM-V-2_6/
  3. 准备coco数据集。
    cd MiniCPM-V/finetune/
    # Download COCO images
    wget http://images.cocodataset.org/zips/train2014.zip && unzip train2014.zip
    wget http://images.cocodataset.org/zips/val2014.zip && unzip val2014.zip
  4. 制作数据集,参考官网下面链接data preparation章节。

    MiniCPM-V/finetune/readme.md at main · OpenBMB/MiniCPM-V (github.com)

    制成coco2014_train.json文件和coco2014_val.json放在MiniCPM-V/finetune/目录中。json文件示例如下。

    图1 json文件示例
  5. 执行微调脚本前需要补充安装依赖包。
    pip install accelerate
    pip install tensorboard
    pip install deepspeed==0.15.1
    pip install peft
    pip install numpy==1.24.4
    pip install transformers==4.40.0
    pip install einops
support.huaweicloud.com/bestpractice-modelarts/modelarts_aigc_mimicpmtrain_9091.html