检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 手写文字示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域有效占比超过
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
财务报表识别 功能介绍 识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
计费样例 计费场景 某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,
使用流程简介 文字识别是指对图像中的打印字符进行检测识别,通过调用API,识别图片中的文字,并返回JSON格式的识别结果。 使用流程 图1 使用流程 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
自定义模板OCR OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取
为IAM用户分配权限 IAM用户自行开通OCR服务 使用主账号登录IAM服务控制台 打开用户组列表,找到子用户所在的用户组,单击该用户组的“授权”操作。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。OCR全部系统权限请参见权限管理。 当现有策略不满足时,可使用OCR自定义策略
发票验真 功能介绍 支持10种增值税发票的信息核验: 增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票、全电发票,支持返回票面的全部信息。 该接口的使用限制请参见约束与限制
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
不同区域是否有时延 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 不过,在基础设施、BGP
OCR自定义策略 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参见权限管理。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取
计费概述 通过阅读本文,您可以快速了解文字识别OCR的计费模式、计费项、续费、欠费等主要计费信息。 计费模式 文字识别提供按需计费和套餐包计费两种计费模式,以满足不同场景下的用户需求。按需计费是一种后付费模式,即先使用再付费,按照文字识别服务实际调用次数计费。套餐包计费是一种预付费模式
计费模式概述 文字识别提供套餐包和按需计费两种计费模式,以满足不同场景下的用户需求。 套餐包计费:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买套餐包规格越大,享受的折扣越大。一般适用于需求量长期稳定的成熟业务。 按需计费:一种后付费模式,即先使用再付费,按照文字识别服务实际成功调用次数结算
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证
项目ID无法获取 问题现象 SDK调用出现如下报错: INFO com.huaweicloud.sdk.core.HcClient - project id of region 'cn-north-4' not found in BasicCredentials, trying to