检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
C++ SDK 本章节介绍新版C++ SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,支持 C++ 14 及以上版本,要求安装 CMake 3.10 及以上版本。 登录“我的凭证 > 访
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
自定义字段类型 如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 在“应用开发>框选识别区”页面单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区。 在右侧“框选识别区”中的“字段类型”下拉框中,单击“创建新字段类型”。 弹出“创建字段类型”对话框。 填写字段类型信息。
什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming I
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 名片示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制
印章识别 功能介绍 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、P
智能文档解析 功能介绍 对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、P
API概览 通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。 文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts
机动车销售发票识别 功能介绍 识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3
行驶证识别 功能介绍 识别行驶证图片中主页和副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别,支持字体分类和长图检测。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
身份证识别 功能介绍 识别身份证图片中的文字内容,并将识别的结果以JSON格式返回给用户。支持身份证翻拍、PS、模糊、反光、边框完整性、边框内异物遮挡、复印件和临时身份证告警功能。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 身份证信息核验请使用人证核身服务。
户口本识别 功能介绍 识别户口本中的文字信息,并返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
财务报表识别 功能介绍 识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
通用表格识别 功能介绍 识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。
银行回单识别 功能介绍 支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页。 图像