检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并框选参照字段,详情请见框选参照字段。
详情请见框选参照字段。 操作步骤 图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。
在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板,最后通过参照字段的位置来校正待识别图片。
在“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应用,详细操作请见创建应用。您可以创建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前
通用单模板工作流”创建应用,详细操作请见6.2 新建应用。您可以创建单模板服务,通过模板配置文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。
别API,则可以利用自定义模板打造出毕业证书识别接口,提取毕业证上的文字信息。 自定义模板支持识别单模板应用或是多模板应用,单模板仅支持一种版式,多模板支持识别多种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。
通用表格识别API 通用文字识别 支持识别图片中的所有印刷体文字信息,可识别中英文和部分繁体字,并以json格式返回识别的文字和坐标位置。 该接口的应用场景广泛,可应用于拍照/截图识别、电子文档格式转化、纸质文档电子化、试题录入、论文素材收集等场景,方便用户进行文字信息的提取和录入,降低人工录入成本。
航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以在选择策略模板后,根据具体需求编辑策略内容;也可以直接在编辑框内编写JSON格式的策略内容。 具体创建步骤请参见:创建自定义策略。 父主题: 权限管理
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
开发应用 通用单模板工作流 根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 通用单模板工作流 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 多模板分类工作流
参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变,如果不满足此要求,可能会提取到错误的识别结果,或是返回AIS.0119(输入图片与模板匹配失败)、AIS
若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
image、url参数为二选一,请勿同时填写。填写时注意格式规范。 功能开关true、false拼写错误。 传参时中英文字符错误。 具体参数格式参见各API的请求参数说明。 AIS.0102 The image format is not supported. 图片格式不支持,或image参数值不是base64编码字符串。
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。云服务进入宽限期/保留期后,华为云将会通过邮件、短信等方式向您发送提醒,提醒您续订或充值。保留期到期仍未续订或充值,存储在云服务中的数据将被删除、云服务资源将被释放。 父主题: 计费FAQ
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
果。 情形2:单模板工作流识别出错,且大部分字段为空或错误。 解决办法:请检查参照字段是否框选正确,或尝试框选更多参照字段(框选办法参照框选参照字段),如果新增参照字段后仍有问题,请检查识别图片与模板图片是否为同一个版式,如果为新版式,请考虑创建新模板或使用多模板分类工作流。 情
持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 自定义模板 自定义模板OCR 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。
Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提