检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
中找出与待识别文字最相似的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。对于多模板应用而言,参照字段还将用于区分不同的模板。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。
委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤。 如果委托不存在时执行接下来的步骤创建委托。 单击“委托”页面的“创建委托”。 在委托名称中输入“rf_admin_trust”,选择“普通账号”,委托的账号,输入“op_svc_IAC”,单击“下一步” 。
通过上传测试图片,在线评估模板识别并提取结构化文字的能力。 首先在“应用开发>评估”页面右侧选择与待评估模板对应的原模板,然后选择本地上传测试图片或者上传在线图片,评估模板。 图4 评估模板 本地上传图片 默认进入“本地上传”页签,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。