检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
活组合以达到最优效果。 针对长期稳定的成熟业务,使用套餐包计费模式。 针对不能中断的短期、突增或不可预测的业务,使用按需计费模式。 实现自动化运维 华为云也提供了丰富的运维类产品,帮助您提升运维效率,降低运维的人力成本。例如: 弹性伸缩:持续维护跨计费模式、跨可用区、跨实例规格的
通用表格识别 智能分类识别 身份证识别 护照识别 营业执照识别 火车票识别 增值税发票识别 飞机行程单识别 06 SDK 文字识别软件开发工具包(Optical Character Recognition Software Development Kit,简称OCR SDK)是对文字识别提供的REST
类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。
已完成模板制作”。 图1 调用指南 完成模板制作后,在“应用开发>调用指南”页面,您可以进行如下操作。 “评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,继续编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。
页面显示“恭喜您,已完成模板制作”。 图1 调用指南 在“应用开发>调用指南”页面,您可以进行如下操作。 “评估”:单击“评估”,继续上传测试图片评估模板。 “继续编辑”:单击“继续编辑”,返回“应用开发>框选参照字段”页面,重新编辑模板。 “返回列表”:单击“返回列表”,返回至应用详情页。
使用SDK前,需要安装“HuaweiCloud.SDK.Core”和“HuaweiCloud.SDK.Ocr”,有两种安装方式,分别如下。 使用 .NET CLI 工具 dotnet add package HuaweiCloud.SDK.Core dotnet add package HuaweiCloud
参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。 模板数量可穷举,建议不超过20种模板,过多的模板会降低分类效果(以实际测试为准,模板差异较大时允许支持更多模板)。 父主题: 常见问题
Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户提升业务效率。 文字识别服务软件开发工具包(OCR SDK,Optical Character Recognition Service Software Development Kit)是对OCR服务提供的REST
数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。 使用公网http/https
营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。
roject_id)。 图2 我的凭证 安装SDK 推荐使用 Composer 安装 SDK 。 Composer 是 Php 的依赖管理工具,允许您在项目中声明依赖关系并安装这些依赖: // 安装 Composer curl -sS https://getcomposer.org/installer
project_id)。 图2 我的凭证 安装SDK 在Linux系统上安装SDK 获取依赖包 所需的这些第三方软件包在大部分系统的包管理工具中都有提供,例如基于 Debian/Ubuntu 的系统。 sudo apt-get install libcurl4-openssl-dev
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
自定义模板OCR OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,
证件类 功能介绍 身份证识别 自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息。 户口本识别 自动识别居民户口本户主页及成员页,并返回部分关键字段信息。 驾驶证识别 自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证
票据类 功能介绍 增值税发票识别 通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片内的文本内容,并返回结
能处理暗光等干扰的图片但影响识别精度。 覆盖常见保险公司的常见保单版式,由于即使是同一家保险公司,保险种类也繁多而且都在动态变化,实际支持情况请以实际测试效果为准。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。
自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。
Go SDK 本章节介绍Go SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,Go SDK 支持 go 1.14 及以上版本,可执行 go version 检查当前 Go 的版本信息。 登录“我的凭证