搜索_华为云

调用SDK实现通用表格识别 - 文字识别 OCR

调用SDK实现通用表格识别文字识别服务软件开发工具包（OCR SDK）是对文字识别服务提供的REST API进行的封装，以简化用户的开发工作。本章节以通用表格识别API为例，介绍如何使用OCR Python SDK。使用OCR SDK的详细步骤如下所示：步骤1：开通服务步骤2：安装SDK

帮助中心 > 文字识别 OCR > 快速入门
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

使用通用单模板工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在自定义OCR控制台选择“通用单模板工作流”创建应用，并上传模板图片，详情请见上传模板图片。定义预处理在“

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

使用多模板分类工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在自定义OCR控制台选择“多模板分类工作流”创建应用，并上传模板图片，详情请见上传模板图片。定义预处理在“

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

智能文档解析功能介绍智能文档解析基于领先的深度学习技术，对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况，可支持多种证件、票据和规范行业文档，适用于各类行业场景。应用场景金融：银行回单、转账存单、理财信息截图等。政务：身份证、结婚证、居住证、各类企业资质证照。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
上传模板图片 - 文字识别 OCR
上传模板图片 - 文字识别 OCR

在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件已在自定义OCR控制台选择“多模

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
什么是文字识别 - 文字识别 OCR

如果您是首次使用OCR的用户，建议您学习并了解如下信息：功能介绍通过功能介绍章节的内容，了解OCR不同类别的文字识别功能，包括通用类文字识别、证件类文字识别、票据类文字识别。入门使用 OCR以开放API的方式提供给用户，您可以参考《快速入门》学习并使用OCR服务。使用方式如

 帮助中心 > 文字识别 OCR > 产品介绍
文字识别 OCR - 文字识别 OCR
文字识别 OCR - 文字识别 OCR

手写文字识别识别文档或图片中的手写文字、印刷文字信息，并将识别的结构化结果以JSON格式返回给用户识别的文字和坐标。该接口可应用于日常学习中对学生作业、试卷的批改、手写内容的电子化，方便用户进行手写信息的提取和处理，降低各行业人力资源成本。支持区域：华北-北京四手写文字识别API

帮助中心 > 文字识别 OCR > 功能总览
文字识别SDK简介 - 文字识别 OCR

Character Recognition Service Software Development Kit）是对OCR服务提供的REST API进行的封装，以简化用户的开发工作。用户直接调用OCR SDK提供的接口函数即可实现使用OCR服务业务能力的目的。我们针对不同语言的SDK提供了开发指南：

帮助中心 > 文字识别 OCR > SDK参考
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模板工作流”创建应用，并框选参照字段，详情请见框选参照字段。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“多模板分类工作流”创建应用，并框选参照字段，详情请见框选参照字段。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
责任共担 - 文字识别 OCR
责任共担 - 文字识别 OCR

《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施，包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。图1 华为云安全责任共担模型父主题：安全

 帮助中心 > 文字识别 OCR > 产品介绍 > 安全
文字识别 - 文字识别 OCR
文字识别 - 文字识别 OCR

Character Recognition Software Development Kit，简称OCR SDK）是对文字识别提供的REST API进行的封装，以简化用户的开发工作。用户直接调用OCR SDK提供的接口函数即可实现使用文字识别服务业务能力的目的。 SDK文档文字识别SDK简介 SDK环境搭建

 帮助中心 > 文字识别 OCR > 成长地图
自定义OCR介绍 - 文字识别 OCR
自定义OCR介绍 - 文字识别 OCR

自定义OCR当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR
上传模板图片 - 文字识别 OCR
上传模板图片 - 文字识别 OCR

确认模板类型后，要准备一张文字清晰的图作为模板图片，模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票图片作为模板，配置文字识别模型就能识别并提取同格式发票上的关键字段。前提条件已在“自定义OCR”控制台选择“通用单模板工作流”创建应用，详情请见6.2新建应用。提

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
身份认证与访问控制 - 文字识别 OCR

身份认证与访问控制身份认证用户访问OCR的方式有多种，包括OCR控制台、API、SDK，无论访问方式封装成何种形式，其本质都是通过OCR提供的REST风格的API接口进行请求。 OCR的接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。

帮助中心 > 文字识别 OCR > 产品介绍 > 安全
评估 - 文字识别 OCR
评估 - 文字识别 OCR

“框选参照字段”、“框选识别区”、“模板总览”步骤，单击“下一步”，进入“评估”页面。图2 评估评估分类器通过上传测试图片，在线评估模型训练的模板分类器是否能正确分类模板。在“应用开发>评估”页面，您可以选择本地上传测试图片，也可以上传在线图片。图3 评估分类器本地上传图片

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

表8 SmartDocumentRecognizerKvResult 参数参数类型描述 kv_block_count Integer 模型识别到的键值对数量。 kv_block_list Array of SmartDocumentRecognizerKVBlock objects

帮助中心 > 文字识别 OCR > API参考 > API
基本概念 - 文字识别 OCR
基本概念 - 文字识别 OCR

建子项目，并在子项目中购买资源，然后以子项目为单位进行授权，使得用户仅能访问特定子项目中资源，使得资源的权限控制更加精确。图1 项目隔离模型父主题：使用前必读

 帮助中心 > 文字识别 OCR > API参考 > 使用前必读
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

新建应用。您可以创建单模板服务，通过模板配置文字识别模型，实现单模板图像的文字信息结构化提取。图1 创建单模板流程表1 创建单模板流程说明流程说明详细指导上传模板图片在使用单模板工作流开发应用之前，需要上传模板图片，明确以哪张图片作为模板训练文字识别模型。上传模板图片定义预处理上

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

通过多模板训练模板分类模型和文字识别模型，实现多模板图像的文字信息结构化提取。图1 创建多模板流程表1 创建多模板流程说明流程说明详细指导上传模板图片在使用多模板工作流开发应用之前，需要上传模板图片，明确以哪些图片作为模板训练文字识别模型。上传模板图片定义预处理

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流

总条数： 21

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用SDK实现通用表格识别 - 文字识别 OCR

定义预处理 - 文字识别 OCR

定义预处理 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

上传模板图片 - 文字识别 OCR

什么是文字识别 - 文字识别 OCR

文字识别 OCR - 文字识别 OCR

文字识别SDK简介 - 文字识别 OCR

框选识别区 - 文字识别 OCR

框选识别区 - 文字识别 OCR

责任共担 - 文字识别 OCR

文字识别 - 文字识别 OCR

自定义OCR介绍 - 文字识别 OCR

上传模板图片 - 文字识别 OCR

身份认证与访问控制 - 文字识别 OCR

评估 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

基本概念 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线