检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录OCR的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的OCR管理事件列表,请参见审计。 父主题: 安全
权限管理 权限管理 创建用户组与IAM用户 为IAM用户分配权限 IAM用户登录并验证权限 OCR自定义策略
关闭服务 OCR服务开通后,如不使用,可登录控制台进行关闭。 如果您是主账户,也可以控制子用户的服务开通、关闭状态。 图1 关闭服务 图2 控制子用户的开通、关闭
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功
车辆通行费发票识别 功能介绍 识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8
手动续费 套餐包文字识别服务从购买到到期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。 在费用中心续费 登录管理控制台。 单击“控制台”页面右上方“费用”,在下拉菜单中选择“续费管理”。 进入“续费管理”页面。 图1 续费管理 自定义查询条件。
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
停售产品套餐包规格如下: 商品名 规格 电子面单识别 电子面单识别套餐包1000万次 电子面单识别套餐包500万次 电子面单识别套餐包100万次 电子面单识别套餐包50万次 电子面单识别套餐包10万次 电子面单识别套餐包1万次 电子面单识别套餐包1千次 如您有任何问题,可随时通过工单
当您完成了调用API、调用SDK基本操作后,可以根据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同
手动续费而导致文字识别服务被自动删除。自动续费的规则如下所述: 文字识别服务自动续费周期根据您开通自动续费的途径不同,遵循不同的规则。 在文字识别服务到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败,每天凌晨3:00尝试一次,直至文字识别服务到期或者续费成功。
该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费 存储策略:多AZ存储 桶策略:私有 存储类别:标准存储
图4 设置用户组 开通服务: 单击“控制台”>“服务列表”>“人工智能”>“文字识别OCR”,进入文字识别控制台。 图5 文字识别控制台 在文字识别控制台“总览”页面,选择对应产品的“终端节点”。不同区域OCR产品部署情况请参考终端节点。 图6 终端节点 选择产品类别,如:通用类、证
未购买套餐包,但开通了按需计费。 欠费影响 套餐包 对于套餐包OCR资源,用户已经预先支付了资源费用,因此在账户出现欠费的情况下,已有的套餐包OCR资源仍可正常使用。然而,对于涉及费用的操作,如新购OCR、续费订单等,用户将无法正常进行。 按需计费 当您的账号因按需OCR资源自动扣费导致欠费后,账号将变成欠
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
常小,几乎可忽略不计。 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。
调用说明 文字识别提供了REST(Representational State Transfer)风格的API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 调用API时,需要用户网络可以访问公网。 同时文字识别还提供多种编程语言的SDK供您使用,SDK的使用方法请参见《SDK参考》。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
服务韧性 OCR提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
准备工作 开通文字识别服务 登录文字识别控制台。 在控制台左上角选择区域为“北京四”,并开通“增值税发票识别”、“发票验真”。 开通后,默认为按需计费。 图1 开通管理 完成文字识别对OBS服务授权。 在文字识别控制台,选择“服务授权”,单击开通授权。 图2 服务授权 创建 rf_amdin_trust