通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
None 服务介绍 文字识别 OCR 文字识别技术简介 01:46 文字识别技术简介 快速入门 文字识别 OCR 使用SDK 06:38 SDK使用指导 文字识别 OCR 使用API 03:04 API使用指导 问题排查 文字识别 OCR 获取Token时帐密报错 03:53 获取
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。
功能总览 功能总览 全部 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别
API文档 API概览 申请服务 通用表格识别 智能分类识别 身份证识别 护照识别 营业执照识别 火车票识别 增值税发票识别 飞机行程单识别 06 SDK 文字识别软件开发工具包(Optical Character Recognition Software Development
华为文字识别(体验) 华为云文字识别服务体验连接器,包含“银行卡识别”与“文字识别”等执行动作。 约束与限制 体验次数,每天5次。 连接参数 华为文字识别(体验)无需认证,无连接参数。 银行卡识别 识别银行卡上的关键文字信息,并返回识别的结构化结果。
华为文字识别 华为文字识别连接器是基于华为云文字识别OCR进行集成开发,文字识别是指对图像中的打印字符进行检测识别,通过调用API,识别图片中的文字,并返回JSON格式的识别结果。华为文字识别连接器包含的执行动作如表1所示。
是否支持生僻字识别,少数民族字体识别 支持部分生僻字识别。 不支持少数民族语言文字识别。 父主题: API使用类
什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
文字识别-发票识别与验真 文字识别-发票识别与验真 查看部署指南 方案咨询 该解决方案有何用途? 该解决方案基于华为云文字识别 OCR增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。
文字识别-网络货运解决方案 文字识别-网络货运解决方案 查看部署指南 方案咨询 该解决方案有何用途?
图1 身份证示例图 身份证识别支持中华人民共和国居民身份证识别。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持中华人民共和国居民身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别,支持字体分类和长图检测。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
表6 WordsRegionList 参数 参数类型 描述 type String 文字识别区域类型。 text:文本识别区域; table:表格识别区域。 words_block_count Integer 子区域识别文字块数目。
文字识别SDK简介 文字识别SDK概述 文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。
车牌识别 功能介绍 识别输入图片中的车牌信息,并以JSON格式返回其坐标和内容。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。
什么是人脸识别 人脸识别服务(Face Recognition Service,简称FRS),是基于人的脸部特征信息,利用计算机对人脸图像进行处理、分析和理解,进行身份识别的一种智能服务。
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。
证件类 证件类 证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、银行卡识别、营业执照识别、名片识别、车牌识别、VIN码识别、道路运输证识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。
该方案可以将用户上传在对象存储服务 OBS的语音文件识别成可编辑的文本,支持中文普通话的识别和合成,其中语音识别还支持带方言口音的普通话识别以及方言(四川话、粤语和上海话)的识别。适用于如下场景:识别客服、客户的语音,进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。
通用类 通用类 通用类OCR(General OCR),支持通用文字识别、通用表格识别、网络图片识别、智能分类识别、手写文字识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。
支持的操作 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别 定额发票识别
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。