检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
调用API实现身份证识别 本章节通过使用Postman软件,调用OCR服务身份证识别API,帮助快速熟悉OCR服务API的使用方法。 使用OCR服务API的详细步骤如下所示: 步骤1:开通服务 步骤2:配置环境 步骤3:Token认证鉴权 步骤4:调用服务 准备工作 注册华为账号
DK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《API参考》手册,该手册详细介绍了如何调用API及各个API接口的详细参数信息。 父主题: SDK使用类
如何通过主账号创建IAM账号 OCR服务支持IAM细粒度划分策略,主账号可以为子用户设置OCR服务的使用权限。 如果您需要将资源分配给企业中不同的员工或者应用程序使用,您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户。 父主题: 权限类
如何查看审计日志 操作场景 在您开启了云审计服务后,系统开始记录云服务器的相关操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。 操作步骤 登录云审计服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事
度。 目前支持识别单张身份证的正面或者反面。 支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。 用户首次使用需要先申请开通。
OCR服务一次可以识别多张身份证吗 不可以一次识别多张身份证,您可以通过循环调用身份证识别API实现多张身份证识别。 父主题: 产品咨询类
username、domainname、project name可登录控制台“我的凭证 > API凭证”页面获取。password为用户密码。 伪码 POST https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens Content-Type:
了解更多常见问题、案例和解决方案 热门案例 如何使用OCR服务? 如何使用SDK调用华为云OCR服务? 如何使用Postman调用华为云OCR服务? 如何处理ModelArts.4204服务未开通报错? OCR服务识别结果可以转化为Word或者TXT吗? OCR服务提供哪些版本的SDK? 如何查看API使用次数?
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
套餐用完如何计费,如何查看剩余量及预警 套餐包配额使用完后,转为按需计费(按API调用成功的次数计费)。不使用则不计费。具体计费价格请参见文字识别价格详情。 查看套餐余量 登录文字识别控制台。 在“套餐包管理”中查看套餐余量。 图1 套餐包管理 设置套餐包剩余使用量预警 单击文字
请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组数字代码,状态码表示了请求响应的状态,如果调用后返回状态码为2xx,则表示调用成功。完整的状态码列表请参见状态码。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。 表1 响应消息头 名称 说明
Array<Array<Integer>> 银行回单的区域位置信息,列表形式,包含文字区域四个顶点的二维坐标(x,y);坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 kv_pair_list Array of BankReceiptKvPair objects 键值对识别结果列表。 表7 BankReceiptKvPair
AM用户。 图2 创建用户 图3 设置用户名、密码 给子账户授予权限请参考权限管理。 图4 设置用户组 开通服务: 单击“控制台”>“服务列表”>“人工智能”>“文字识别OCR”,进入文字识别控制台。 图5 文字识别控制台 在文字识别控制台“总览”页面,选择对应产品的“终端节点”
模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。 约束与限制 只支持识别PNG、JPG、PNG、BMP、TIFF、GIF、WEBP格式图片。 图像
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。 已开通通用文字识别。
本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
如何解决账号锁定“The account is locked.” 华为云账号锁定后,请等待15分钟,重新进行登录。如果需要修改密码,请参见重置密码(可选)。 重置密码(可选) 主动修改密码 如果您的华为云账号暂未升级成华为账号,且您记得当前密码,需要主动修改密码,可以在“基本信息”中修改自己的密码。