检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。 票据类
和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。取值范围:支持小写字母、数字、中划线(-)、英文句号(.)。 无默认值,桶名可以自定义。例如
化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 网络图片识别 自动识别网络图片内的所有文字及其对应位置信息,如果图片包含联系人信息,也支持联系人信
图1 护照示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持中国大陆护照的全字段识别。 支持含有完整机读码的中国-港澳台地区及外国护照识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 side
的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR
SDK提供的接口函数即可实现使用OCR服务业务能力的目的。 我们针对不同语言的SDK提供了开发指南: 表1 不同语言SDK的开发指南 编程语言 开发指南 Java Java SDK 开发指南 Python Python SDK 开发指南 Node.js Node.js SDK 开发指南 PHP PHP SDK
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interf
些信息,请提前保存。 本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。 图2 我的凭证 安装SDK 在Linux系统上安装SDK 获取依赖包 所需的这些第三方软件包在大部分系统的包管理工具中都有提供,例如基于 Debian/Ubuntu 的系统。 sudo
与data二选一。 图片或PDF的URL路径,目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。 OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。 具体的声明请参考隐私政策声明和法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明。
车牌识别 自动识别图片中的车牌信息。 名片识别 自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。 VIN码识别 自动识别图片上的车架号信息。 泰文身份证识别 自动识别身份证上的全部信息,一次扫
授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 template_id 否 String 该参数与classifier_id二选一。
销货清单的备注。 当传入图片为发票销货清单时返回此字段。 belong_issue_date String 销货清单的填开日期。 当传入图片为发票销货清单时返回此字段。 sales_mark Boolean 是否是销货清单: true:输入图片是销货清单。 false:输入图片不是销货清单。
响应超时异常 CallTimeoutException 单次请求,服务器处理超时未返回。 RetryOutageException 在重试策略消耗完成后,仍无有效的响应。 ServiceResponseException 服务器响应异常 ServerResponseException 服务端内部错误,Http响应码:[500
入成本。 支持区域: 华北-北京四 通用文字识别API 网络图片识别 支持识别网络图片中的所有印刷体、艺术字等文字信息,可识别中英文及部分繁体字以及常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片,能够返回位置坐标和置信度,方便用户进行版式的二次处理以及提高
火车票识别:识别火车票中的文字信息,并返回识别的结构化结果。 银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。 商用 - 3 新增护照识别、道路运输证识别 护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证