检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
身份认证与访问控制 身份认证 用户访问OCR的方式有多种,包括OCR控制台、API、SDK,无论访问方式封装成何种形式,其本质都是通过OCR提供的REST风格的API接口进行请求。 OCR的接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。
如果您购买了多个套餐包,则套餐包的扣减规则如下。 按照套餐包来源类型扣费,扣减优先级由高到低为:免费权益 -> 促销 -> 订购 按套餐包创建、生效、失效时间扣费。 多个套餐包,创建时间相同时,优先抵扣先生效的。 多个套餐包,生效时间相同时,优先抵扣先失效的。 多个套餐包,失效时间相同时,优先抵扣先创建的。
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
资源和成本规划 该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
在进行卸载之前,需要先删除该方案创建的委托。 删除委托 登录统一身份认证服务(IAM)控制台。在“委托”菜单栏中找到以该方案OBS桶名称为前缀的委托,单击“删除”。 图1 删除委托 在弹出的删除确认框中单击“是”进行删除。 图2 确认删除 一键卸载 登录发票识别与验真解决方案部署页面。 单击方案堆栈后的“删除”。
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
创建企业项目后,在传参时,有以下三类场景。 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
明细账单”查看资源的费用账单,并找到对应的计费产品/规格(如:通用文字识别)、区域(如:华北-北京四)等信息。 图1 明细账单 进入文字识别控制台,按照查询到的计费产品/规格和区域进入到对应的购买界面(如:华北-北京四的通用文字识别),单击开通管理,查询到依然处于开通状态的用户,并单击“取消服务”即可。
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。 图2 服务授权 创建 rf_amdin_trust
偏移、由上下文长度变化引起的偏移等。 多模板的前提: 分类器中的任一模板,均需满足上述单模板的要求。 模板种类固定,识别不在多模板中的图片可能会返回错误的结果或无法识别。 模板间有足够的区分度,不同模板要有不同的参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服务。一般情况下
Key(SK)。下载的访问密钥为credentials.csv文件,包含AK/SK信息。 图1 新增访问密钥 登录“我的凭证 ”页面,获取“IAM用户名”、“账号名”以及待使用区域的“项目ID”。调用服务时会用到这些信息,请提前保存。 本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。
password is wrong.” 获取Token返回401状态码 使用Postman调用时,出现获取Token失败的情况 无编程访问权限 使用Postman调用时,出现标头溢出的情况
API是否可以混用 不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类
单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图片旋转”窗口,鼠标选中调整图片的方向,然后单击“确认”,调整图片的方向。 :单击图标,向左旋转图片90°。 :单击图标,向右旋转图片90°。 :单击图标,缩小图片大小。
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
OCR服务是否支持离线使用 不支持离线使用,调用SDK必须能够访问公网才可以的,因为OCR接口部署在华为云云端,所以需要您的网络可以访问公网才可以调用服务接口。 父主题: 产品咨询类
尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平 5:1