检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。 OCR能力
道路运输证识别 功能介绍 识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。
在Postman左侧导航栏中单击“OCR_idcard”配置文件。 根据自身文字识别服务需求选择相应的POST类型。(OCR_idcard:身份证识别,OCR_auto_classification:智能分类识别,OCR-webimage:网络图片识别) 登录我的凭证,获取“华北-北京四”区域的项目ID,
全部 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别 定额发票识别
发票识别与验真 方案概述 资源和成本规划 实施步骤
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
例如D:\local\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
定额发票识别 功能介绍 识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。
识别户口本中的文字信息,并返回识别的结构化结果。 行驶证识别 识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 驾驶证识别 识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 护照识别 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 银行卡识别 识别银行卡
多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。 能处理反光、暗光等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。
通过OCR体验馆在线调用OCR服务API。 如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学者,有代码编写基础,对HTTP请求与API调用有一定的
飞机行程单识别 自动识别飞机行程单的全部信息,一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。 定额发票识别 自动识别定额发票的全部信息,一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。 火车票识别 自动识别火车票的全部信息,一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。