检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图2 编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 父主题:
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“分类器列表”页签,选择多模板名称,单击操作列的“删除”。
编辑”。 图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3.5-框选识别区 6.3.6-评估 6.3
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模板列表”页签,选择模板名称,单击操作列的“删除”。
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
模板总览 预览分类器下面所有模板的状态,如果有模板的识别区未设置,则无法进行后续的评估。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选添加的多个模板的识别区,详情请见框选识别区。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应
评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成模板评估后,单
识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 框选识别区 在“应用开发>框选识别区
识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 多模板框选识别区 在“应用开发>框选
一键式部署,快速输出高精度结构化数据。 解决单据复杂、单据板式多、语种多问题,支持自定义多个图像板式,快速适配新板式,快速接入业务。 支持从多个不同板式图像中提取结构化信息。 工作流流程 在“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应用,详细操作请见创建应用。您可以创
对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。 数据要求
动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在“自定义OCR控制台”选择“通用单模板工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。
默认字段类型 当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后,将会按照指定的字段类型对字符串处理后再输出。比如,未激活任何字段类型时的输出为“发证日期:2021年09月12日”,为了精准提取日期
在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中使用字符串替换、正则抽取等规则来修正识别结果。
用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方或者“选择模
包含业务需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。
OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用 OCR服务一次可以识别多张身份证吗 身份证识别可以判断身份证真假么