AI开发平台MODELARTS-使用ModelArts PyCharm插件调试训练ResNet50图像分类模型:步骤2:使用PyCharm进行本地开发调试
步骤2:使用PyCharm进行本地开发调试
- 下载代码至本地。
- 配置本地PC开发环境。
执行pip命令安装:
# 在PyCharm的Terminal安装mindspore pip install mindspore==1.7.0 --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple # 在PyCharm的Terminal安装resnet依赖 pip install -r .\official\cv\resnet\requirements.txt --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple
图4 安装resnet依赖
- 准备数据集。
本样例使用的数据集为类别数为五类的花卉识别数据集,下载数据集并解压数据到工程目录。新建dataset文件夹,将解压后数据集保存在dataset文件夹下。
图5 准备数据集
- 配置PyCharm解释器和入参。
单击右上角“Current File”,选择“Edit Configuration”,打开“Run/Debug Configuration”对话框。在对话框中单击“+”,选择“Python”。图6 前往PyCharm解释器
“Script path”选择train.py文件,“Parameters”命令如下所示,并选择Python解释器,然后单击“OK”:
--net_name=resnet50 --dataset=imagenet2012 --data_path=../../../dataset/flower_photos/ --class_num=5 --config_path=./config/resnet50_imagenet2012_config.yaml --epoch_size=1 --device_target="CPU"
图7 配置PyCharm解释器
根据README说明文档,配置Parameter参数device_target="CPU"表示CPU环境运行,device_target="Ascend"表示在Ascend环境运行。
- 本地代码开发调测。
一般本地CPU算力较低并且内存较小,可能出现内存溢出的报错,因此可以把“models/official/cv/resnet/config/resnet50_imagenet2012_config.yaml”的“batch_size”由“256”改为“32”,使得训练作业可以快速运行。
图8 修改batch_size
AI开发过程中的数据集开发及模型开发是和硬件规格无关的,而且这一部分的开发耗时是最长的,因此可以先在本地PC的CPU环境进行数据集和模型开发调试。
本例中,因为样例代码已经支持在CPU上进行训练,因此用户能够在CPU上完成整个训练流程。如果代码只支持在GPU或者Ascend上训练,那么可能会报错,需要使用Notebook进行云端调试。
设置断点后单击“调试”,可实现代码逐步调试,查看中间变量值。
图9 “调试”按钮
图10 通过设置断点实现代码调试
可单击“运行”按钮,通过日志观察是否能正常训练。
图11 “运行”按钮
图12 训练日志