检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK
调用API实现身份证识别 本章节通过使用Postman软件,调用OCR服务身份证识别API,帮助快速熟悉OCR服务API的使用方法。 使用OCR服务API的详细步骤如下所示: 步骤1:开通服务 步骤2:配置环境 步骤3:Token认证鉴权 步骤4:调用服务 准备工作 注册华为账号
如何通过主账号创建IAM账号 OCR服务支持IAM细粒度划分策略,主账号可以为子用户设置OCR服务的使用权限。 如果您需要将资源分配给企业中不同的员工或者应用程序使用,您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户。 父主题: 权限类
套餐用完如何计费,如何查看剩余量及预警 套餐包配额使用完后,转为按需计费(按API调用成功的次数计费)。不使用则不计费。具体计费价格请参见文字识别价格详情。 查看套餐余量 登录文字识别控制台。 在“套餐包管理”中查看套餐余量。 图1 套餐包管理 设置套餐包剩余使用量预警 单击文字
构造请求 本节介绍REST API请求的组成,并以调用网络图片识别接口说明如何调用API。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987 。 请求URI 请求URI由如下部分组成。 {URI-scheme}
如何调用API 总览 开通服务 构造请求 认证鉴权 返回结果
根据实际情况选填,参数部分可参考APIE界面的“接口文档”。 单击调试,在“调试结果”中查看调用结果。 图1 APIE在线调试 父主题: 如何调用API
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
meet the requirements." } 其中,error_code表示错误码,error_msg表示错误描述信息。 父主题: 如何调用API
使用文字识别服务时,可以通过配置OBS访问权限搭配使用。服务只需要配置一次即可,后面使用时无需再次配置,详细信息请参见配置OBS访问权限章节。 父主题: 如何调用API
如何查看审计日志 操作场景 在您开启了云审计服务后,系统开始记录云服务器的相关操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。 操作步骤 登录云审计服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事
如果多个云服务一起搭配使用,需要注意: 不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。 不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区? 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。
oken”就是需要获取的用户Token。获取Token之后,您就可以使用Token认证调用OCR服务API。 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333 。 图1 获取Token示例 图2
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
DK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《API参考》手册,该手册详细介绍了如何调用API及各个API接口的详细参数信息。 父主题: SDK使用类
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64