检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别,支持字体分类和长图检测。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。
银行卡识别 功能介绍 识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 银行卡示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 手写文字示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域
护照识别 功能介绍 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限
印章识别 功能介绍 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、P
财务报表识别 功能介绍 识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
银行回单识别 功能介绍 支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页。 图像
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token在计算机系统中代表令牌
状态码 HTTP 状态码为三位数,分成五个类别:1xx:相关信息;2xx:操作成功;3xx:重定向;4xx:客户端错误;5xx:服务器错误。 状态码如下所示。 状态码 编码 状态说明 100 Continue 继续请求。 这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。
V1版本APIs切换至V2版指导 华为云文字识别OCR服务计划于2023/03/30 00:00下线退市V1版本APIs接口服务。届时V1版本的OCR接口将不可用,此次接口版本的升级涉及文字识别OCR服务所有的API接口,如能未及时进行版本切换,则无法使用产品服务。 接口转换过程
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
支持云审计的关键操作 操作场景 平台提供了云审计服务。通过云审计服务,您可以记录与OCR相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的OCR操作列表 操作名称 资源类型 事件名称 开通服务 ai_service
创建企业项目 创建企业项目的用户必须是管理员,或在IAM侧已被授予EPS FullAccess权限的用户。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。 图1 操作流程 创建IAM用户并授权使用OCR 创建
云容器引擎-成长地图 | 华为云 文字识别 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本