检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
dk-php 安装完毕后,你需要引入 Composer 的自动加载文件: require 'path/to/vendor/autoload.php'; 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。
OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。
Key(SK)。下载的访问密钥为credentials.csv文件,包含AK/SK信息。 图1 新增访问密钥 登录“我的凭证 ”页面,获取“IAM用户名”、“账号名”以及待使用区域的“项目ID”。调用服务时会用到这些信息,请提前保存。 本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。
将图②处的”cn-north-4”修改为实际区域并替换相应的{project_id},服务部署的区域具体请参见终端节点。 单击“Headers”配置项。将获取的Token复制到“X-Auth-Token”值中。 图5 修改配置文件 单击“Body”配置项,将待识别图片的base64编码填写到“image”参数中。
Key(SK)。下载的访问密钥为credentials.csv文件,包含AK/SK信息。 图1 新增访问密钥 登录“我的凭证”页面,获取“IAM用户名”、“账号名”以及待使用区域的“项目ID”。调用服务时会用到这些信息,请提前保存。 本样例以“华北-北京四”区域为例,获取对应的项目ID(project_id)。
(x86)\huaweicloud-sdk-cpp-v3。 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以参考安装SDK完成sdk的安装和编译。 导入依赖模块 //include <cstdlib> //include
ore npm i @huaweicloud/huaweicloud-sdk-ocr 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题或无法使用最新功能。您可以通过运行以下命令来检查并更新SDK至最新版本。 npm list @hua
125</version> </dependency> 当出现第三方库冲突的时,如Jackson,okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后),该包包含所有支持的服务和重定向了SDK依赖的第三方软件,避免和业务自身依赖的库产生冲突: <dependency> <groupId>com
g(config)”相应的代码,详情请参见4.初始化客户端(二选一)中的client后的代码。 配置认证信息 配置AK、SK、project_id信息。华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。有两种认证方式,分别如下。
SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。对于多模板应用而言,参照字段还将用于区分不同的模板。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。
创建IAM用户步骤请参见创建用户组与IAM用户,为IAM用户授权使用OCR请参见为IAM用户分配权限。 创建企业项目 登录控制台,单击界面右上方的“企业 > 项目管理”。 屏幕分辨率低的情况下单击页面右上方的“更多 > 企业 > 项目管理”。 图2 企业项目入口 在企业项目管理页面,单击页面右上方“创建企业项目”。依据界面指引完成企业项目的创建。
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤2:安装SDK 步骤3:获取示例代码
框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 评估 通过上传与模板图片同一板式的测试图片,评估图片识别结果是否正确。 评估 调用指南
Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
password is wrong.” 获取Token返回401状态码 使用Postman调用时,出现获取Token失败的情况 无编程访问权限 使用Postman调用时,出现标头溢出的情况
获取Token返回401状态码有以下几种情况: Token的有效期为24小时,使用Token方式调用OCR服务返回401状态码,表示Token已经过期。建议重新获取Token调用OCR服务。 您的IAM账号的账号名与主账号的账号名一致,为了保证您的资产安全,限制了该账号下的token不可用。建议您新建一个
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。