检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。 图像各边的像素大小在15到30000px之间。 图像中有效文字图片占比超过60%,避免有效文字图片占比过小。 支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
自动识别图片中的车牌信息。 名片识别 自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。 VIN码识别 自动识别图片上的车架号信息。 泰文身份证识别 自动识别身份证上的全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。
图片质量类报错处理办法 问题现象 调用文字识别API时,产生以下图片质量类报错。 错误码AIS.0102:图片格式不支持。 错误码AIS.0103:图片尺寸不满足要求。 错误码AIS.0104:非支持的图片类型或图片质量差。 解决方法 请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。
识别的结构化结果。 银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。 商用 - 3 新增护照识别、道路运输证识别 护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证识别:识
如果您需要对华为云上购买的OCR资源,为企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
”为单位。 ≥0次每分钟 文字识别 每个子服务都有调用成功次数和失败次数两个指标。 对象存储服务 对象存储服务(Object Storage Service,简称OBS)是稳定、安全、高效、易用的云存储服务。文字识别接口都涉及到对用户的数据处理,用户的大量数据采用OBS批量方式处理,可以提升云上处理的总体效率。
受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。 AIS.0104 The image is not supported or the image quality is poor. 非支持的图片类型或图片质量差。 请检查图片类型与图片质量。 请检查调用的接口是否正确。
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
超级API 支持对各类卡证和票据的单张图像识别,也支持多种卡证票据的任意组合混贴场景的分类识别。 调用更加便捷 直接统一调用一个API即可完成对各种卡、证、票的识别,无需在调用时判断图像类型,也不用再对每种数据分别调用不同的API,降低了集成使用的复杂度。 价格更优惠 价格详情请参考OCR服务价格计算器。
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
保留,且文字识别服务的运行不受影响。文字识别服务到期后的状态说明,请参见到期后影响。 续费相关的功能 套餐包文字识别服务续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 套餐包文字识别服务从购买到套餐包截止日期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。