检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练分类器 评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
支持从多个不同板式图像中提取结构化信息。 父主题: 应用开发套件
合同录入与审核 自动识别结构化信息与提取签名盖章区域,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。
预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
模型训练、更新的流程自动化,只需要客户自己上传标注图片,就可以在线完成模型训练、评估、发布。 图3 零售场景 物流场景 物流场景需要处理各种格式的票据图片,用户可以通过简单的标注生成自己的专属模板,实现关键字段的自动识别和提取。
评估模板 通过上传测试图片,在线评估模板识别并提取结构化文字的能力。 首先在“应用开发>评估”页面右侧选择与待评估模板对应的原模板,然后选择本地上传测试图片或者上传在线图片,评估模板。
通过上传模板图片、框选参照字段和识别区、上传训练集,自动训练并生成模板分类器和文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务自动分类模板并识别模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。
配额说明 本服务在使用数据集、在线服务、训练任务资源时涉及配额限制。 其配额查看及修改请参见关于配额。
不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。
不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。 父主题: 通用单模板工作流
不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。 父主题: 多模板分类工作流
不填写时,默认提取全部字段。 如果需要多个提取规则,单击新增提取规则。提取时按从上到下优先级规则提取,选择第一个非空的提取内容作为提取后的内容。 后处理 根据实际情况,对经过“提取”后的文字进行“后处理”。
图1 应用基本信息 在线测试应用 在“应用监控”页面,您可以针对“运行中”的应用使用在线测试功能,在“上传测试图片”右侧单击“选择文件”,上传本地的测试图片,下侧会显示预测结果。
服务部署方式 当前只支持在线部署方式。 计算节点规格 界面选择计算规格。 服务自动停止 设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。 部署成功后,页面显示“服务部署成功”。
文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。
在ModelArts Pro使用预置工作流部署服务后,可通过调用API和SDK调用已部署的在线服务。如果调用API失败,可根据返回的错误码及错误信息解决问题,具体的错误码说明请见表1。
例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。
例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。