检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
IFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中名片的有效占比超过60%,保证整张名片内容包含在图像内。 支持图像中名片的任意角度的水平旋转(需开启方向检测)。 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。 前提条件
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别 营业执照识别、名片识别 票据类
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
行驶证识别 功能介绍 识别行驶证图片中主页和副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。
增值税发票识别 功能介绍 识别增值税发票的类别,并以JSON格式返回识别的结构化结果,支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 发票验真API请参见发票验真。 图1 增值税发票示例图 图2 区块链发票示例图 图3
只支持中国大陆道路运输证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。 支持图像中道路运输证任意角度的水平旋转。 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。 前提条件 在使用
护照识别 功能介绍 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。
与image二选一 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
定额发票识别 功能介绍 识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
电子面单识别 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准。 支持识别JPG、PNG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 调用方法
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。