检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图解文字识别
为其余子用户取消开通车牌识别服务 √ × ocr:webImage:subscribe 开通网络图片识别服务 √ × ocr:webImage:unsubscribe 取消开通网络图片识别服务 √ × ocr:webImage:getSubscribeUserList 查询开通网络图片识别的用户列表
框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 模板总览 检查所有模板是否已正确配置。
参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。
图3 获取识别结果文件 通过华为云SDK使用 企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上传发票图片或者电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。
准备数据 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
道路运输从业资格证 自动识别道路运输从业资格证,根据不同版式内容返回对应的关键文字信息,可用于货运场景资质审核场景。 车辆合格证 自动识别出车辆合格证图片的文本内容,并返回结构化字段信息。 不动产证 自动识别出不动产证图片的文本内容,并返回结构化字段信息。
获取识别结果 解读识别结果 识别结果后处理
该方式无需编程,只需在网页端上传图片,即可体验识别效果。 开通OCR后,默认按API成功调用次数进行收费。API使用指导请参见使用流程简介。 使用OCR体验馆前,请先注册华为账号并开通华为云,并实名认证。 图1 OCR体验馆
在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。
可选值包括: true:打开单朝向模式 false:关闭单朝向模式 图片文字方向一致时,打开该开关可提升识别精度;图片文字方向不一致时,关闭该开关可支持多朝向文字识别。未传入该参数时默认为true,既默认图片中的字段为单朝向。
手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 网络图片识别 自动识别网络图片内的所有文字及其对应位置信息,如果图片包含联系人信息,也支持联系人信息的提取,同时可供进一步的数据挖掘后处理操作。
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估.
图3 配置参数 表1 参数说明 参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。
接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类
单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。 多模板的前提: 分类器中的任一模板,均需满足上述单模板的要求。
例如,对于网络图片识别接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示。
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。