检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
全部 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别 定额发票识别
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 名片示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认
行驶证识别 功能介绍 识别行驶证图片中主页和副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制
增值税发票识别 功能介绍 识别增值税发票的类别,并以JSON格式返回识别的结构化结果,支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 发票验真API请参见发票验真。 图1 增值税发票示例图 图2 区块链发票示例图 图3
护照识别 功能介绍 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限
道路运输证识别 功能介绍 识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域
对接OCR识别图片中文字 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 在
图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
对接OCR实现图片上文字识别功能 背景信息 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。
基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 对象存储服务 OBS:对象存储服务(Object