AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step5 转换模型文件

时间：2024-05-16 12:45:45

AI开发平台MODELARTS 内容审核

Step5 转换模型文件

将onnx模型文件转换为mindir格式模型文件。转换过程中涉及到的参数需要查看原始onnx文件，此处提供查看的脚本文件get_onnx.py，具体的脚步文件内容见附录：get_onnx.py脚本内容。

模型转换命令如下。

export model_name="model"
export LD_LIBRARY_PATH=/home/ma-user/anaconda3/envs/python-3.9.10/lib/:${LD_LIBRARY_PATH}
converter_lite --modelFile=./${model_name}.onnx --outputFile=./${model_name} --fmk=ONNX --saveType=MINDIR --optimize=ascend_oriented --inputShape="input_ids:4,96;attention_mask:4,96;token_type_ids:4,96"

--modelFile：模型名称。
--outputFile：输出模型名称。模型名称无需添加.mindir后缀，添加后对后续测试流程存在一定影响。
--inputShape：根据onnx输出的name:shape进行修改，可以通过get_onnx.py脚本查看，如图1所示。

图1 get_onnx.py脚本查看输入参数

如需进行AOE优化，则需配置一个config.ini文件，文件内容如下。

[ascend_context]
plugin_custom_ops=FlashAttention,GroupNormSilu,GeGluV2 
aoe_mode="subgraph tuning, operator tuning"

AOE优化命令如下，只需将以上模型转换命令添加一个--configFile=config.ini即可。

converter_lite --modelFile=./${model_name}.onnx --
outputFile=./${model_name} --fmk=ONNX --saveType=MINDIR --optimize=ascend_oriented --inputShape="input_ids:4,96;attention_mask:4,96;token_type_ids:4,96" --configFile=config.ini

benchmark测试命令如下。

benchmark --device=Ascend --modelFile=${model_name}.mindir

图2 benchmark测试

上一篇：AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step1 准备环境

下一篇：AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step1 准备环境

华为云11.11 2核1G 2M 云服务器

29元/年

立即注册领万元上云礼券

抽奖赢11111元免单

续费同价 L实例 2核2G 4M

98元/年

热门域名 1元随心购

1元/年

AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step5 转换模型文件

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step5 转换模型文件

AI开发平台MODELARTS-06 BERT和YOLO等常用小模型适配NPU推理指导:Step5 转换模型文件

Step5 转换模型文件

7*24

备案

专业服务

退订

建议反馈

售前咨询热线