AI开发平台MODELARTS-使用ModelArts PyCharm插件调试训练ResNet50图像分类模型:步骤2:使用PyCharm进行本地开发调试

时间:2025-01-24 14:44:58

步骤2:使用PyCharm进行本地开发调试

  1. 下载代码至本地。
    本案例中,以图像分类模型resnet50模型为例,路径为“./models/official/cv/resnet/”
    # 在本地电脑Terminal下载代码至本地
    git clone https://gitee.com/mindspore/models.git -b v1.5.0
    图3 下载代码至本地
  2. 配置本地PC开发环境。
    修改“models/official/cv/resnet/requirements.txt”文件,改为:
    numpy==1.17.5
    scipy==1.5.4
    easydict==1.9
    执行pip命令安装:
    # 在PyCharm的Terminal安装mindspore
    pip install mindspore==1.7.0 --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple
    # 在PyCharm的Terminal安装resnet依赖
    pip install -r .\official\cv\resnet\requirements.txt --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple
    图4 安装resnet依赖
  3. 准备数据集。

    本样例使用的数据集为类别数为五类的花卉识别数据集,下载数据集并解压数据到工程目录。新建dataset文件夹,将解压后数据集保存在dataset文件夹下。

    图5 准备数据集
  4. 配置PyCharm解释器和入参。
    单击右上角“Current File”,选择“Edit Configuration”,打开“Run/Debug Configuration”对话框。在对话框中单击“+”,选择“Python”
    图6 前往PyCharm解释器

    “Script path”选择train.py文件,“Parameters”命令如下所示,并选择Python解释器,然后单击“OK”

    --net_name=resnet50 --dataset=imagenet2012 --data_path=../../../dataset/flower_photos/ --class_num=5 --config_path=./config/resnet50_imagenet2012_config.yaml --epoch_size=1 --device_target="CPU"
    图7 配置PyCharm解释器

    根据README说明文档,配置Parameter参数device_target="CPU"表示CPU环境运行,device_target="Ascend"表示在Ascend环境运行。

  5. 本地代码开发调测。

    一般本地CPU算力较低并且内存较小,可能出现内存溢出的报错,因此可以把“models/official/cv/resnet/config/resnet50_imagenet2012_config.yaml”“batch_size”“256”改为“32”,使得训练作业可以快速运行。

    图8 修改batch_size

    AI开发过程中的数据集开发及模型开发是和硬件规格无关的,而且这一部分的开发耗时是最长的,因此可以先在本地PC的CPU环境进行数据集和模型开发调试。

    本例中,因为样例代码已经支持在CPU上进行训练,因此用户能够在CPU上完成整个训练流程。如果代码只支持在GPU或者Ascend上训练,那么可能会报错,需要使用Notebook进行云端调试。

    设置断点后单击“调试”,可实现代码逐步调试,查看中间变量值。

    图9 “调试”按钮
    图10 通过设置断点实现代码调试

    可单击“运行”按钮,通过日志观察是否能正常训练。

    图11 “运行”按钮
    图12 训练日志
support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0021.html