检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取识别结果 解读识别结果 识别结果后处理
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。
单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。 您可以核对识别结果是否正确。 如果不正确,可单击“创建新模板”,重新创建一个模板,或者单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。
桶后,即可自动进行文字识别和验真,企业业务系统只需定时从存储结果的OBS桶中获取结果,即可实现发票报销的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 示例发票 示例结果 发票识别与验真结果如下所示,'status'字段为'valid',表示该发票有效
N格式的识别结果。 使用流程 图1 使用流程 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通
OCR服务识别结果可以转化为Word、TXT、pdf吗 OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。 父主题: API使用类
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
已完成模板制作”。 图1 调用指南 完成模板制作后,在“应用开发>调用指南”页面,您可以进行如下操作。 “评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,继续编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。
页面显示“恭喜您,已完成模板制作”。 图1 调用指南 在“应用开发>调用指南”页面,您可以进行如下操作。 “评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,重新编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。
OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性
模板种类固定,识别不在多模板中的图片可能会返回错误的结果或无法识别。 模板间有足够的区分度,不同模板要有不同的参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。 模板数量可穷举,建议不超过20种模板,过多的模板会降低分类效果(以实际测试为准,模板差异较大时允许支持更多模板)。
情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类结果是否正确(返回结果中的template_id表示分类结果),若分类错误,则说明分类器中存在相似的模板导致分类出错,请在参照字段中添加模板特有的参照字段,从而提高分类的鉴别能力。若分类结果正确,但识别结果错误,请参照情形2的解决办法。 父主题:
置。 框选识别区 模板总览 检查所有模板是否已正确配置。 模板总览 评估 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 评估 父主题: 多模板分类工作流
框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 评估 通过上传与模板图片同一板式的测试图片,评估图片识别结果是否正确。 评估 调用指南 生成模板ID和自定义文字识别接口,用于识别自己所上传的模板样式的图片。提供标准API和常用编程语言的
身份证识别可以判断身份证真假么 不支持判断身份证的真假,该服务可以识别身份证图片中的文字内容,并将识别的结果以json格式返回给用户。 父主题: 产品咨询类