检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么情况下可以使用自定义模板? 自定义模板是一款用于提取卡证、票据和文档图片中自定义区域信息的文字识别产品。当您要识别的证件或票据种类不在华为云OCR API支持之中,并且识别图片的版式固定,则可以使用本产品提取自定义版式、自定义区域的文字信息。比如,目前华为云尚未推出毕业证书识别
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type
无编程访问权限 调用API时,出现"code":403,"message":"This user only supports console access, not programmatic access."表示用户没有编程访问权限。 子用户没有编程访问权限,需要联系主账户进行权限设置
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全
为IAM用户分配权限 IAM用户自行开通OCR服务 使用主账号登录IAM服务控制台 打开用户组列表,找到子用户所在的用户组,单击该用户组的“授权”操作。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。OCR全部系统权限请参见权限管理。 当现有策略不满足时,可使用OCR自定义策略
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
不同区域是否有时延 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 不过,在基础设施、BGP
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。 登录访问密钥页面
资源和成本规划 该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费
最新动态 本文介绍了文字识别OCR各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2021年8月 序号 功能名称 功能描述 阶段 相关文档 1 身份证识别功能优化 支持校验身份证号等信息。 身份证号合法性 身份证号与出生日期一致性 身份证号与性别一致性
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
方案概述 应用场景 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。支持增值税发票、增值税普通发票
计费模式概述 文字识别提供套餐包和按需计费两种计费模式,以满足不同场景下的用户需求。 套餐包计费:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买套餐包规格越大,享受的折扣越大。一般适用于需求量长期稳定的成熟业务。 按需计费:一种后付费模式,即先使用再付费,按照文字识别服务实际成功调用次数结算
身份认证与访问控制 身份认证 用户访问OCR的方式有多种,包括OCR控制台、API、SDK,无论访问方式封装成何种形式,其本质都是通过OCR提供的REST风格的API接口进行请求。 OCR的接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求
APIG.0307报错处理方法 如果调用API时返回错误信息与错误码:"error_msg":"The token must be updated.","error_code":"APIG.0307",是因为Token失效,需要进行更新。 您可以尝试以下方案进行解决。 Token有效期为
快速卸载 在进行卸载之前,需要先删除该方案创建的委托。 删除委托 登录统一身份认证服务(IAM)控制台。在“委托”菜单栏中找到以该方案OBS桶名称为前缀的委托,单击“删除”。 图1 删除委托 在弹出的删除确认框中单击“是”进行删除。 图2 确认删除 一键卸载 登录发票识别与验真解决方案部署页面
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”,
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成模板评估后
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface