搜索_华为云

通用类 - 文字识别 OCR
通用类 - 文字识别 OCR

化信息。通用文字识别提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。手写文字识别识别文档中的手写文字信息，并将识别的结构化结果返回给用户。网络图片识别自动识别网络图片内的所有文字及其对应位置信息，如果图片包含联系人信息，也支持联系人信

 帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
什么是文字识别 - 文字识别 OCR

通用类OCR（General OCR），支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别，自适应分析各种版面和表格，快速实现各种文档电子化。证件类 OCR 证件类OCR（Card OCR），支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。票据类

 帮助中心 > 文字识别 OCR > 产品介绍
构造请求 - 文字识别 OCR
构造请求 - 文字识别 OCR

构造请求本节介绍REST API请求的组成，并以调用网络图片识别接口说明如何调用API。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987 。请求URI 请求URI由如下部分组成。 {URI-scheme}

帮助中心 > 文字识别 OCR > API参考 > 如何调用API
开始使用 - 文字识别 OCR
开始使用 - 文字识别 OCR

登录华为云对象存储服务控制台，查看部署完成后，自动创建的OBS桶列表。图1 对象存储服务控制台选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”，上传示例发票图片或者电子发票pdf文件。图2 上传待识别发票选择用于存放结果的“ocr-invoice-r

帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真 > 实施步骤
自定义模板OCR - 文字识别 OCR
自定义模板OCR - 文字识别 OCR

授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 template_id 否 String 该参数与classifier_id二选一。

帮助中心 > 文字识别 OCR > API参考 > API
ModelArts.4603、ModelArts.4704报错处理方法 - 文字识别 OCR

OBS failed. "表示从OBS获取图片数据失败，请确保存储图片的OBS路径存在且可访问，如果路径存在，请确保设置OBS桶策略为公共桶。建议：不要使用跨区域的OBS路径，如果OBS与调用服务部署区域不属于用一个区域，建议本地下载图片后使用image的调用方式。父主题：错误码类

 帮助中心 > 文字识别 OCR > 常见问题 > 错误码类
护照识别 - 文字识别 OCR
护照识别 - 文字识别 OCR

image 否 String 该参数与url二选一。图片的Base64编码，要求Base64编码后大小不超过10MB。图片最短边不小于15px，最长边不超过8192px，支持JPEG、JPG、PNG、BMP、TIFF格式。图片Base64编码示例如/9j/4AAQSkZJRgABAg

帮助中心 > 文字识别 OCR > API参考 > API
身份证识别 - 文字识别 OCR
身份证识别 - 文字识别 OCR

授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 side

帮助中心 > 文字识别 OCR > API参考 > API
文字识别SDK简介 - 文字识别 OCR

文字识别SDK简介文字识别SDK概述文字识别（Optical Character Recognition，简称OCR）将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入，提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。文字识别以开放API（Application

帮助中心 > 文字识别 OCR > SDK参考
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。

帮助中心 > 文字识别 OCR > API参考
概述 - 文字识别 OCR
概述 - 文字识别 OCR

概述文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming Interf

帮助中心 > 文字识别 OCR > API参考 > 使用前必读
功能体验与试用 - 文字识别 OCR

过API提供服务能力，用户需要通过编程来处理识别结果。在开通OCR前，请先使用OCR体验馆体验服务功能。该方式无需编程，只需在网页端上传图片，即可体验识别效果。开通OCR后，默认按API成功调用次数进行收费。API使用指导请参见使用流程简介。使用OCR体验馆前，请先注册华为账号并开通华为云，并实名认证。

帮助中心 > 文字识别 OCR > 用户指南
手写文字识别 - 文字识别 OCR
手写文字识别 - 文字识别 OCR

接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 quick_mode 否 Boolean 快速模式开关，针对单行文字图片（要求

 帮助中心 > 文字识别 OCR > API参考 > API
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

API或SDK时，数据主要通过以下两种方法传入。 image 传入图片的base64编码。您可以通过在线转码工具，浏览器，使用Python中的base64.b64encode函数等方法，获取图片的base64编码。 url 传入图片的url路径。使用公网http/https url，例如https://support

帮助中心 > 文字识别 OCR > 用户指南
配置OBS访问权限 - 文字识别 OCR

开启公共读授权（可选）配置公共读可参考《对象存储服务控制台指南》配置标准桶策略，创建桶策略为“公共读”。一般私密数据不建议用此方法。 “私有桶”策略（可选） OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。使用临时授权请求鉴权开启公共读授权访问，虽

 帮助中心 > 文字识别 OCR > API参考 > 附录
本地调用 - 文字识别 OCR
本地调用 - 文字识别 OCR

本地调用本章节以通用表格识别为例，介绍如何使用OCR Python SDK在本地进行开发。该接口可以识别表格图片中的文字内容，并将识别结果以JSON格式返回给用户。返回结果包含两类：纯文本区（text）和表格区（table），并返回表格结构（row, column）和文本信息。

帮助中心 > 文字识别 OCR > 用户指南 > 调用API或SDK
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

与data二选一。图片或PDF的URL路径，目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API
泰文身份证识别 - 文字识别 OCR

说明 image 否 String 与url二选一。图片的Base64编码，要求Base64编码后大小不超过10MB。图片最短边不小于15px，最长边不超过8192px，支持JPEG、JPG、PNG、BMP、TIFF格式。图片Base64编码示例如/9j/4AAQSkZJRgABAg

帮助中心 > 文字识别 OCR > API参考 > API
哥伦比亚身份证识别 - 文字识别 OCR

String 与image二选一。图片的url路径，目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限>。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API
户口本识别 - 文字识别 OCR
户口本识别 - 文字识别 OCR

描述 image 否 String 与url二选一。图片的Base64编码，要求base64编码后大小不超过10MB。图片最小边不小于15px，最长边不超过8192px，支持JPEG、JPG、PNG、BMP、TIFF格式。图片Base64编码示例如/9j/4AAQSkZJRgABAg

帮助中心 > 文字识别 OCR > API参考 > API

总条数： 135

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通用类 - 文字识别 OCR

什么是文字识别 - 文字识别 OCR

构造请求 - 文字识别 OCR

开始使用 - 文字识别 OCR

自定义模板OCR - 文字识别 OCR

ModelArts.4603、ModelArts.4704报错处理方法 - 文字识别 OCR

护照识别 - 文字识别 OCR

身份证识别 - 文字识别 OCR

文字识别SDK简介 - 文字识别 OCR

API概览 - 文字识别 OCR

概述 - 文字识别 OCR

功能体验与试用 - 文字识别 OCR

手写文字识别 - 文字识别 OCR

准备数据 - 文字识别 OCR

配置OBS访问权限 - 文字识别 OCR

本地调用 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

泰文身份证识别 - 文字识别 OCR

哥伦比亚身份证识别 - 文字识别 OCR

户口本识别 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线