检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
计费项 计费说明 按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。 购买文字识别服务请参考如何选购合适的API。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。
错误码 调用接口出错后,将不会返回结果数据。调用方可根据每个接口对应的错误码来定位错误原因。当调用出错时,HTTPS请求返回一个 4xx 或 5xx 的 HTTPS状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时,可以联系华为云客服技术支持,并提供错误码,以便尽快帮您解决问题。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
IAM用户登录并验证权限 使用新创建的IAM账户登录控制台,切换至授权区域,进行验证权限。 假设IAM用户只具备“OCR ReadOnlyAccess”权限,即只读访问权限,使IAM用户仅具备使用服务能力,开通/关闭服务需要主账户操作。 进入OCR控制台界面,单击“开通服务”,如
cribe 取消开通通用文字识别服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers 为其余子用户开通通用文字识别服务 √ × ocr:g
受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
String 文字块识别结果。 location Array<Array<Integer>> 文字块的区域位置信息,列表形式,包含文字区域四个顶点的二维坐标(x,y);坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 confidence Float 文字块识别结果的置信度。
该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费 存储策略:多AZ存储 桶策略:私有 存储类别:标准存储
监控 文字识别的监控指标 查看监控指标
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。 图2 服务授权 创建 rf_amdin_trust
续费简介 套餐包文字识别服务到期后会影响文字识别服务正常运行。如果您想继续使用,需要在指定的时间内为文字识别服务续费,否则资源会自动释放,数据丢失且不可恢复。 续费操作仅适用于套餐包文字识别服务,按需计费文字识别服务不需要续费,只需要保证账户余额充足即可。 文字识别服务在到期前续费
详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 成本中心可以通过监控文字识别服务的历史消费情况和CPU使用率,为客户提供文字识别服务资源的空闲识别和优化建议,寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源,通过云监控服务监控资源的使用情况,确定成本偏高的原因,然后采取针对性的优化措施。
某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,3,200元),购买时长为1
续费 套餐包文字识别服务在到期后会自动转为按需计费。如果您想继续使用文字识别服务套餐包,需要为文字识别服务进行续费。续费包括手动续费和自动续费两种方式,您可以根据需求选择。了解更多关于续费的信息,请参见续费概述。 费用账单 您可以在“费用中心 > 账单管理”查看与文字识别相关的流水
Python SDK 本章节介绍新版Python SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,支持Python3及以上版本。 登录“我的凭证 > 访问密钥”页面,依据界面操作指引获取Access