检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自动化部署步骤 登录华为云解决方案实施库,选择“一键部署”。 图1 一键部署发票识别与验真 在选择模板界面中,直接单击“下一步:配置参数”。 图2 选择模板 在配置参数界面中,自定义填写堆栈名称。根据表完成参数配置后,单击“下一步:高级配置”。 图3 配置参数 表1 参数说明 参数名称
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
Python SDK 本章节介绍新版Python SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,支持Python3及以上版本。 登录“我的凭证 > 访问密钥”页面,依据界面操作指引获取Access
本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。 图2 我的凭证 安装SDK 在Linux系统上安装SDK 获取依赖包 所需的这些第三方软件包在大部分系统的包管理工具中都有提供,例如基于 Debian/Ubuntu 的系统。 sudo apt-get install libcurl4-openssl-dev
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming I
申请服务 通用表格识别 智能分类识别 身份证识别 护照识别 营业执照识别 火车票识别 增值税发票识别 飞机行程单识别 06 SDK 文字识别软件开发工具包(Optical Character Recognition Software Development Kit,简称OCR SDK)是对文字识别提供的REST
方案概述 应用场景 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。支持增值税发票、增值税
证件类 功能介绍 身份证识别 自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息。 户口本识别 自动识别居民户口本户主页及成员页,并返回部分关键字段信息。 驾驶证识别 自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
功能总览 功能总览 全部 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
求与API调用,您可以通过postman调用、调试API。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频。 通过软件开发工具包(SDK)调用OCR服务API。 如果您是开发工程师,熟悉代码编写,OCR服务为您提供Java、Python、Node.js等版
Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户提升业务效率。 文字识别服务软件开发工具包(OCR SDK,Optical Character Recognition Service Software Development
OCR自定义策略 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参见权限管理。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。
通用类 功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别
银行回单识别 功能介绍 支持对银行回单版式进行文字识别及键值对提取,实现高效的自动化结构化返回。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页。 图像
工作流介绍 工作流简介 功能介绍 支持用户自定义多个文字识别模板,通过模型分类,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别
工作流介绍 工作流简介 功能介绍 支持构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
调用API实现身份证识别 本章节通过使用Postman软件,调用OCR服务身份证识别API,帮助快速熟悉OCR服务API的使用方法。 使用OCR服务API的详细步骤如下所示: 步骤1:开通服务 步骤2:配置环境 步骤3:Token认证鉴权 步骤4:调用服务 准备工作 注册华为账号