检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码
一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题。 父主题: 区域与可用区
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片内的文本内容,并返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。 飞机行程单识别 自动识别飞机行程单的全部信息,一次扫描即可识
OCR服务是否支持离线使用 不支持离线使用,调用SDK必须能够访问公网才可以的,因为OCR接口部署在华为云云端,所以需要您的网络可以访问公网才可以调用服务接口。 父主题: 产品咨询类
","error_code":"APIG.0106",表示需要检查API配置的前后端参数是否合理。 API的前端参数配置了校验规则,调用时没有满足,则会产生此报错。 您可以尝试以下解决方法: 检查参数的必填项是否填写完整。 检查参数规则是否正确,例如参数值必须填写为数字等。 父主题:
框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 评估 通过上传与模板图片同一板式的测试图片,评估图片识别结果是否正确。 评估 调用指南
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
按需计费时,调用区域(Region)需和开通时的区域保持一致,否则会提示ModelArts.4204服务未开通。例如,开通华北-北京四区域的身份证识别服务,调用该服务接口时应对应开通时的华北-北京四区域。 套餐包计费时,调用区域(Region)需和购买时的区域保持一致, 套餐包不支持跨区调用,否则会出现额外的计费或欠费。
种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。 多模板的前提: 分类器中的任一模板,均需满足上述单模板的要求。 模板种类固
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
行业类 电子面单 识别各类快递公司的电子面单主要信息,包含三段码、收寄件人姓名电话地址及条形码运单号,快速提取信息,提高信息录入效率。 保险单 支持多版式的保险单关键信息,支持寿险险种,识别主要投保信息包括保险单号、保险公司、投保人与被投保人姓名,性别,出生日期,证件类型、证件号等。可用于保险报销和信息录入场景。
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数