检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服务
其中,中国护照支持所有关键字段识别,包括国家码、国籍、护照号码、护照类型、姓名、姓名拼音、性别、出生地点、出生日期、签发地点、签发日期、有效期、签发机关(支持境外签发地);外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取6-7个关键字段信息。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
OCR的并发是多少 文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。 如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法: 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一个请求结果
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
OCR服务识别结果可以转化为Word、TXT、pdf吗 OCR提取之后返回的结果是JSON格式,需要用户通过编程,将结果保存为Word、TXT、pdf格式。 父主题: API使用类
识别身份证正反面总计调用几次接口 使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。 父主题: API使用类
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
为什么实际调用次数与界面记录次数不一致 OCR控制台只记录服务调用成功的次数,调用失败的次数不计算在使用量内。 请参照如下操作查看调用失败的次数: 登录管理控制台。 在控制台首页选择“文字识别”,进入“文字识别”界面。 选择对应的服务(如:“智能分类识别”),单击“查看监控数据”,
调用OCR服务的区域可以与OBS资源的区域不一致吗 不支持跨区域OBS,OBS的区域需要和调用服务区域保持一致。 对于开启公共读授权的OBS资源公网可访问,可支持跨区域调用,虽然使用比较方便,但若对于敏感的信息,例如个人的私有数据,存在泄露风险。建议您调用的文字识别服务和OBS服务是在同一个区域
OCR是否支持事业单位和社会团体营业执照识别 OCR服务无事业单位和社会团体营业执照识别单独的API,建议使用智能文档解析API调试。 父主题: 产品咨询类
监控安全风险 OCR提供基于云监控服务CES的监控能力,帮助用户监控账号下的OCR服务API,执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生的调用成功次数、调用失败次数等信息。 关于OCR支持的监控指标,以及如何创建监控告警规则等内容,请参见监控。 同时,OCR控制台支持监控账号下的
ModelArts.4204报错处理方法 如果在调用API时提示"error_code":"ModelArts.4204","error_msg":"Request api error! The API XXX is not subscribed. ”,表示未开通对应服务,用户需要开通该服务
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类