检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当您完成了调用API、调用SDK基本操作后,可以根据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查
手动续费而导致文字识别服务被自动删除。自动续费的规则如下所述: 文字识别服务自动续费周期根据您开通自动续费的途径不同,遵循不同的规则。 在文字识别服务到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败,每天凌晨3:00尝试一次,直至文字识别服务到期或者续费成功。
OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序
功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文
功能介绍 智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别 场景三:不同类型发票识别
服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录OCR的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的OCR管理事件列表,请参见审计。
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
给子账户授予权限请参考权限管理。 图4 设置用户组 开通服务: 单击“控制台”>“服务列表”>“人工智能”>“文字识别OCR”,进入文字识别控制台。 图5 文字识别控制台 在文字识别控制台“总览”页面,选择对应产品的“终端节点”。不同区域OCR产品部署情况请参考终端节点。 图6 终端节点
权限管理 权限管理 创建用户组与IAM用户 为IAM用户分配权限 IAM用户登录并验证权限 OCR自定义策略
关闭服务 OCR服务开通后,如不使用,可登录控制台进行关闭。 如果您是主账户,也可以控制子用户的服务开通、关闭状态。 图1 关闭服务 图2 控制子用户的开通、关闭
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用 OCR服务一次可以识别多张身份证吗 身份证识别可以判断身份证真假么
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 用户购买服务套餐包的区域与实际调用区域不一致。 免费试用区域与实际调用区域不一致。 购买的服务与实际调用的服务类型不一致。 购买的套餐
调用说明 文字识别提供了REST(Representational State Transfer)风格的API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 调用API时,需要用户网络可以访问公网。 同时文字识别还提供多种编程语言的SDK供您使用,SDK的使用方法请参见《SDK参考》。
1.1及TLS 1.2版本,推荐您使用更加安全的TLS 1.2版本。 数据存储 华为云OCR承诺数据不落盘,用户的原始图片和识别结果数据均不作保留,识别返回后立即释放。 父主题: 安全
套餐用完如何计费,如何查看剩余量及预警 企业主账号购买的套餐包资源,子账号如何使用 多个套餐包扣减顺序 什么是宽限期和保留期 OCR识别中,哪些算有效计费 不同API的套餐包是否可以共享 OCR文字识别服务计费可以按照项目来分别计费吗
描述 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时不返回此字段。 error_msg String 调用失败时返回的错误信息。 调用成功时不返回此字段。 请求示例 “endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点。
headers=headers, data=payload) print(response.headers["X-Subject-Token"]) 如下图所示,返回的响应消息头中“x-subject-token”就是需要获取的用户Token。获取Token之后,您就可以使用Token认证调用OCR服务API。
统计API使用量 文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。 如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。 图1 服务监控