检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ModelArts Pro的应用场景和用户群体 ModelArts Pro基于华为云的先进算法和快速训练能力,提供预置工作流和模型。用户可以使用ModelArts Pro套件中特定行业场景的预置行业工作流,满足快速定制的需求,快速进行应用开发。 当前ModelArts Pro开放
如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较好的选择。 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API和SDK,推
用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。 步骤2:新建应用 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
多模板分类工作流可以通过追加训练分类器,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。 如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
查看评估参数对比和详细评估。 模型评估 图6 模型评估 训练模型的版本、标签数量、测试集数量。单击“下载评估结果”,可保存评估结果至本地。 评估参数对比 图7 评估参数对比 左侧是各个标签数据的精确率、召回率、F1值。勾选标签,右侧会显示对应标签数据经过预置模型和增量模型评估后的参数对比柱状图。
根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 创建多模板 调用API和SDK 部署服务后,支持通过调用API和SDK调用当前模板服务。 调用API和SDK 父主题: 文字识别套件
ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。同时,支持客户自主进行工作流编排,快速实现应用的开发、共享和发布,共建开放生态,实现普惠行业AI落地。 ModelArts Pro