检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。
票和表单图片上有效信息的自动识别和结构化提取。 行业类 OCR 行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。 首次使用OCR 如果您是首次使用OCR的用户,建议您学习并了解如下信息: 功能介绍
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
github.com/huaweicloud/huaweicloud-sdk-go-v3 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。 go list -m all
Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 如果您的华为云账号已升级
开通状态 如果主账号或被授予所有权限(OCR FullAccess)的IAM子账号需要为自己开通某个服务,可以在开通管理界面为自己或标记有Everyone的账号开通服务。开通everyone权限将会为此账号下的所有IAM子用户(包括未来新增子用户)开通此服务。 父主题: 服务开通类
请求次数0-100万次/月:免费 计量时间:0-400,000GB/秒:免费 节点执行次数:0-5000次:免费 0 总计 - 约410.14元 本文提供的成本预估费用仅供参考,资源的实际费用以华为云管理控制台显示为准。 父主题: 发票识别与验真
模糊等干扰;支持任意倾斜角度的校正;支持身份证信息的有效性校验,如校验身份证号规则、校验出生日期与身份证号所表示的出生日期是否一致、校验性别与身份证号所表示的性别信息是否一致、校验当前日期是否在有效期内,可以在一定程度上判断身份证的有效性。 该接口的应用场景广泛,可应用于远程身份
按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码
API调用,计费以Https请求返回的状态码为准,当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。 OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费OCR资源的计费规则。 适用场景 按需计费适用于具有不能中断的短期、突增或不可预测的应用或服务。 适用计费项 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。
将图②处的”cn-north-4”修改为实际区域并替换相应的{project_id},服务部署的区域具体请参见终端节点。 单击“Headers”配置项。将获取的Token复制到“X-Auth-Token”值中。 图5 修改配置文件 单击“Body”配置项,将待识别图片的base64编码填写到“image”参数中。
识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。 关于如何压缩图片,请参考以下代码。
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
OCR的并发是多少 文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。 如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一
状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。 表1 响应消息头 名称 说明 Content-Length 响应消息体的字节长度,单位为Byte。
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数