检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
16:30:30 操作步骤 登录管理控制台。 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 在文字识别列页面,选择“终端节点”和要开通的服务,并在操作列单击“购买套餐包”。 在“购买文字识别套餐包”页面,选择服务类型、套餐包规格和购买数量。 单击“立即购买”后进入购买页面。
数据安全与隐私 使用OCR服务,是否会保存用户数据
区域与可用区 区域与可用区 API是否可以跨区域调用 不同区域是否有时延
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。
约束与限制 更详细的限制请参见具体API的说明和产品介绍约束与限制。 父主题: 使用前必读
基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云
接口参考 基础配置 业务接口(主动调用) 业务接口(全局推送IShareEventHandler方法) 父主题: Android接口参考
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
直接统一调用一个API即可完成对各种卡、证、票的识别,无需在调用时判断图像类型,也不用再对每种数据分别调用不同的API,降低了集成使用的复杂度。 价格更优惠 价格详情请参考OCR服务价格计算器。 降低管理难度 无需对每个API的调用量进行单独的预测,然后分别购买不同大小的套餐包。以发票报销为例,很难分别对每种发票的
资源和成本规划 该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费 存储策略:多AZ存储
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
权限说明 SDK已申请存储、截屏、悬浮窗权限,需要用户授权。 父主题: 说明
开始使用 1、网络图片识别:支持图片格式等约束信息详网络图片识别文档 2、电子面单识别:支持图片格式等约束信息详电子面单识别文档 登录对象存储服务 OBS控制台,在桶列表选择快速部署 步骤三创建的用于上传快递图片的OBS桶,可直接上传图片或上传压缩包(支持zip及tar格式),如
实施步骤 准备工作 自动化部署步骤 开始使用 快速卸载 父主题: 发票识别与验真
OBS桶名称,全局唯一,用于存放识别认证结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 空 登录华为云解决方案实践,选择“文字识别-网络货运解决方案”,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板
日期 版本 变更内容 2021-02-02 1.0.0 初稿-已实现接口参考 2021-02-09 1.0.0.1 接口优化 父主题: Android接口参考
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg: