检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 手写文字示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
颜色矩阵 图1 颜色矩阵 颜色值矩阵:下表中,各颜色值同上述示意图一一对应。 表1 颜色矩阵 颜色值 FF000000 FF595959 FFA5A5A5 FFFFFFFF FF8E2323 FFB20000 FFDB7070 FFFF4C4C FF8E5923 FFB25900
行驶证识别 功能介绍 识别行驶证图片中主页和副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。 OCR能力
增值税发票识别 功能介绍 识别增值税发票的类别,并以JSON格式返回识别的结构化结果,支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 发票验真API请参见发票验真。 图1 增值税发票示例图 图2 区块链发票示例图 图3
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制
识别结果 敏感数据识别任务扫描完成后,可在结果明细界面查看识别结果详情,同时支持将生成的识别结果下载到本地查看,本章节介绍如何查看识别结果以及下载识别结果。 前提条件 至少执行过一次敏感数据识别任务,新建敏感数据识别任务请参见新建敏感数据识别任务。 查看识别结果 登录管理控制台。
识别、护照识别等功能。 API文档 API概览 申请服务 通用表格识别 智能分类识别 身份证识别 护照识别 营业执照识别 火车票识别 增值税发票识别 飞机行程单识别 06 SDK 文字识别软件开发工具包(Optical Character Recognition Software
击链接或识别二维码进行学习 操作路径:培训-学习-学习项目-更多-分享 图21 分享1 图22 分享2 数据监控 通过查看学员培训进度,监控学员学习状态 操作路径:培训-学习-学习项目-数据 图23 数据监控1 图24 数据监控2 任务监控统计的是以任务形式分派的学员学习数据 自
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 名片示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
输入值为护照颁发国的国家码,根据国家码选择对应的护照识别服务。 若输入中未选此字段,服务会根据自己识别判断的护照类型匹配相应的护照识别服务。 若选择值为“GENERAL”,则选择护照机器码识别。 若选择值为“CHN”,则选择中国护照全字段识别。 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status
道路运输证识别 功能介绍 识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。
实时语音识别工作流程 实时语音识别分为开始识别、发送音频数据、结束识别,断开连接四个阶段。 开始阶段需要发送开始指令,包含采样率,音频格式,是否返回中间结果等配置信息。服务端会返回一个开始响应。 发送音频阶段客户端会分片发送音频数据,服务会返回识别结果或者其他事件,如音频超时,静音部分过长等。
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
例如D:\local\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip
提供“自动学习白盒化”能力,开放模型参数、自动生成模型,实现模板化开发,提高开发效率 采用自动深度学习技术,通过迁移学习(只通过少量数据生成高质量的模型),多维度下的模型架构自动设计(神经网络搜索和自适应模型调优),和更快、更准的训练参数自动调优自动训练 采用自动机器学习技术,基于
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
迁移学习 如果当前数据集的特征数据不够理想,而此数据集的数据类别和一份理想的数据集部分重合或者相差不大的时候,可以使用特征迁移功能,将理想数据集的特征数据迁移到当前数据集中。 进行特征迁移前,请先完成如下操作: 将源数据集和目标数据集导入系统,详细操作请参见数据集。 创建迁移数据