搜索_华为云

定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

统自动旋转文字方向不正确的图片，保持图片中的文字方向正确。单击预处理区域左上方的操作图标，调整模板图片的大小、方向等。：单击图标重置图片为初始状态，即未进行任何处理的状态。：单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。：单击图标，在“图

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。框选识别区应尽量扩大识别区范围，使所框选识别区覆盖字段值可能出现的区域。在右侧“框选识别区”中填写“框选字段”，选择“字段类型”。 “字段类型”指待识别文字的内容，您可以在默认字段类型中选择，当前可选择的默认字段

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

保证模型识别的准确性。定义预处理框选参照字段在图片模板中框选参照字段，用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。对于多模板应用而言，参照字段还将用于区分不同的模板。框选参照字段框选识别区在图片模板中框选识别区，确定模板图片中需要识别的文字位置。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

理”逻辑快速处理图片，也可以按左上角操作指标调整图片。图1 定义预处理右侧“选择预处理逻辑”区域勾选对应操作，当前仅支持“自动旋转”操作，系统自动旋转文字方向不正确的图片，保持图片中的文字方向水平。单击预处理区域左上方的操作图标，调整模板图片的大小、方向等。：单击图标重置

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
统计API使用量 - 文字识别 OCR
统计API使用量 - 文字识别 OCR

统计API使用量文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。如果您购买了套餐包，可在“套餐包管理”页面，查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。图1 服务监控

 帮助中心 > 文字识别 OCR > 用户指南
证件类 - 文字识别 OCR
证件类 - 文字识别 OCR

自动识别图片上的车架号信息。泰文身份证识别自动识别身份证上的全部信息，一次扫描即可识别身份证号码、姓名、地址等全部信息。泰国车牌识别识别泰国车牌图片中的车牌信息，返回识别结果和车牌的区域位置信息。道路运输从业资格证自动识别道路运输从业资格证，根据不同版式内容返回对应的关键文字信息，可用于货运场景资质审核场景。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
构造请求 - 文字识别 OCR
构造请求 - 文字识别 OCR

单独传递它，所以在此单独强调。表1 URI中的参数说明参数说明 URI-scheme 表示用于传输请求的协议，当前所有API均采用HTTPS协议。 endpoint 指定承载REST服务端点的服务器域名或IP，不同服务不同区域的endpoint不同，您可以从终端节点章节查看。

帮助中心 > 文字识别 OCR > API参考 > 如何调用API
ModelArts.4603、ModelArts.4704报错处理方法 - 文字识别 OCR

"表示从URL获取图片数据失败，可通过以下几个方面进行排查：（1）请确保提供的URL支持HTTP/HTTPS请求协议，即格式为http/https url；（2）请检查存储图片的服务器是否稳定可靠，网络连接是否有异常，是否公网可访问；（3）请检查下载图片的content-type是否为标准类型，例如：im

帮助中心 > 文字识别 OCR > 常见问题 > 错误码类
APIG.0307报错处理方法 - 文字识别 OCR

您可以尝试以下方案进行解决。 Token有效期为24小时，请使用重新获取Token调用API。检查接口URL中的终端节点是否填写正确。部署在不同区域间的服务，不可以跨区域调用。如果调用了不同区域的接口，导致判断为Token失效，显示APIG.0307错误码。父主题：错误码类

 帮助中心 > 文字识别 OCR > 常见问题 > 错误码类
总览 - 文字识别 OCR
总览 - 文字识别 OCR

步骤二配置的环境选择认证鉴权的方式。构造请求：Postman环境的构造请求请参考构造请求章节，SDK环境的API调用详见SDK参考。除上述两种方式外，还可通过APIE在线调试的方式调用API，步骤如下。开通服务后进入APIE界面。选择已开通的服务和开通服务对应的Region。

帮助中心 > 文字识别 OCR > API参考 > 如何调用API
Node.js SDK - 文字识别 OCR
Node.js SDK - 文字识别 OCR

Key（SK）。下载的访问密钥为credentials.csv文件，包含AK/SK信息。图1 新增访问密钥登录“我的凭证 ”页面，获取“IAM用户名”、“账号名”以及待使用区域的“项目ID”。调用服务时会用到这些信息，请提前保存。本样例以“华北-北京四”区域为例，获取对应的项目ID（project_id）。

帮助中心 > 文字识别 OCR > SDK参考
IAM用户登录并验证权限 - 文字识别 OCR

IAM用户登录并验证权限使用新创建的IAM账户登录控制台，切换至授权区域，进行验证权限。假设IAM用户只具备“OCR ReadOnlyAccess”权限，即只读访问权限，使IAM用户仅具备使用服务能力，开通/关闭服务需要主账户操作。进入OCR控制台界面，单击“开通服务”，如

 帮助中心 > 文字识别 OCR > 用户指南 > 权限管理
本地调用 - 文字识别 OCR
本地调用 - 文字识别 OCR

本地调用本章节以通用表格识别为例，介绍如何使用OCR Python SDK在本地进行开发。该接口可以识别表格图片中的文字内容，并将识别结果以JSON格式返回给用户。返回结果包含两类：纯文本区（text）和表格区（table），并返回表格结构（row, column）和文本信息。

帮助中心 > 文字识别 OCR > 用户指南 > 调用API或SDK
计费样例 - 文字识别 OCR
计费样例 - 文字识别 OCR

计费样例计费场景某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。成功调用5000次之后，用户发现此服务识别效果可以满足业务需求，因此打算长期使用下去，并于2023/03/20 10:30:00将通用文字识别转为套餐包计费（10万次套餐包，3

帮助中心 > 文字识别 OCR > 计费说明
获取账号ID - 文字识别 OCR
获取账号ID - 文字识别 OCR

获取账号ID 在调用接口的时候，部分URL中需要填入账号ID（domain-id），所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下：注册并登录管理控制台。单击用户名，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看账号ID。图1 查看账号ID

帮助中心 > 文字识别 OCR > API参考 > 附录
如何提高识别精度 - 文字识别 OCR

如何提高识别精度尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平

 帮助中心 > 文字识别 OCR > 常见问题 > API使用类
创建应用 - 文字识别 OCR
创建应用 - 文字识别 OCR

文字识别控制台在“我的应用”页签下，单击“创建应用”。进入“创建应用”页面。图2 创建应用您也可以单击“我的工作流”，切换至“我的工作流”页签，选择工作流并单击卡片中的“创建应用”。根据业务需求填写“应用名称”、“应用负责人”和“应用描述”，仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR
方案概述 - 文字识别 OCR
方案概述 - 文字识别 OCR

创建用于存储发票识别与验真结果的OBS桶，企业业务系统定时从该桶中获取结果并处理。函数工作流：用于实现调用文字识别服务的业务逻辑，当OBS桶收到上传的发票文件后，会自动通知函数调用文字识别服务，并将结果存放到指定的OBS桶里。文字识别服务：提供发票识别与验真服务，识别用户上传的发票内容以及对接国税局系统进行真伪验证。

帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真
文字识别 - 文字识别 OCR
文字识别 - 文字识别 OCR

OCR服务提供哪些版本的SDK？如何查看API使用次数？如何关闭已申请的服务？更多产品咨询类 OCR服务能否实时处理视频流中的文字？增值税发票识别支持哪些发票？关于数据安全，隐私保护的有什么措施？ OCR服务的SDK需要付费购买吗？ OCR服务的SDK是否依赖于maven管理依赖包？

帮助中心 > 文字识别 OCR > 成长地图
SDK使用类 - 文字识别 OCR
SDK使用类 - 文字识别 OCR

SDK使用类 OCR服务提供哪些版本的SDK OCR服务的SDK需要付费购买吗 OCR服务的SDK是否依赖于Maven管理依赖包如何修改返回结果的response类型 SSL配置报错 Connect timed out 报错处理项目ID无法获取使用依赖后，导入demo无对应接口信息

 帮助中心 > 文字识别 OCR > 常见问题

总条数： 237

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

定义预处理 - 文字识别 OCR

框选识别区 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

定义预处理 - 文字识别 OCR

统计API使用量 - 文字识别 OCR

证件类 - 文字识别 OCR

构造请求 - 文字识别 OCR

ModelArts.4603、ModelArts.4704报错处理方法 - 文字识别 OCR

APIG.0307报错处理方法 - 文字识别 OCR

总览 - 文字识别 OCR

Node.js SDK - 文字识别 OCR

IAM用户登录并验证权限 - 文字识别 OCR

本地调用 - 文字识别 OCR

计费样例 - 文字识别 OCR

获取账号ID - 文字识别 OCR

如何提高识别精度 - 文字识别 OCR

创建应用 - 文字识别 OCR

方案概述 - 文字识别 OCR

文字识别 - 文字识别 OCR

SDK使用类 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线