检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
APIG.0308报错处理方法 如果调用API时返回错误信息与错误码:"error_msg":"The throttling threshold has been reached: policy user over ratelimit,limit:XX,time:1 minute"
配置OBS访问权限 EI企业智能服务对于图片、语音等多媒体文件支持直接使用OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。 考虑到数据的安全,当对服务进行授权后,才可以使用授权方式的URL(https://<bucket-name>.<end
套餐包 套餐包是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择套餐包的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍套餐包OCR资源的计费规则。 适用场景 套餐包计费模式需要用户预先支付一定使用次数的费用,适用于长期、稳定的
手动续费 套餐包文字识别服务从购买到到期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。 在费用中心续费 登录管理控制台。 单击“控制台”页面右上方“费用”,在下拉菜单中选择“续费管理”。 进入“续费管理”页面。 图1 续费管理 自定义查询条件。
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
准备数据 数据要求 受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
保险单识别 功能介绍 识别保险单图片上的文字信息,并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素在15px到8192px之间。 图像中保险单区域
调用API实现身份证识别 本章节通过使用Postman软件,调用OCR服务身份证识别API,帮助快速熟悉OCR服务API的使用方法。 使用OCR服务API的详细步骤如下所示: 步骤1:开通服务 步骤2:配置环境 步骤3:Token认证鉴权 步骤4:调用服务 准备工作 注册华为账号
基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云
自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
框选参照字段 在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
入门实践 当您完成了调用API、调用SDK基本操作后,可以根据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
停止计费 套餐包资源 对于套餐包计费模式的资源,例如套餐包的文字识别,用户在购买时会一次性付费,套餐包资源将在到期后自动停止使用。 购买的套餐包到期后如果没有购买新的套餐包,系统会自动转为按需计费。 套餐包购买后暂不支持退款,请在购买时选择合适的套餐包。 如果您已开启“自动续费”
智能文档解析 功能介绍 对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、P
获取项目ID 从控制台获取项目ID 登录管理控制台。 鼠标移动到右上角的用户名上,在下拉列表中选择“我的凭证”。 在“我的凭证 > API凭证”页面,可以查看用户名、账号名,在项目列表中查看项目。 图1 查看项目ID 多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。 调用API获取项目ID
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID