搜索_华为云

使用单模板工作流开发应用 - 企业级AI应用开发专业套件 ModelArts Pro

Pro的文字识别套件提供了通用单模板工作流，通过工作流指引可构建文字识别模板，识别单个板式图片中的文字，快速实现文档、票证等场景的文字识别。本章节提供一个身份证样例，帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区，自动训

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 快速入门 > 文字识别套件
行业套件介绍 - 企业级AI应用开发专业套件 ModelArts Pro

行业套件介绍文字识别套件基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。文字识别套件的介绍请参见产品介绍。预置工作流文字识别套件当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
权限管理 - 文字识别 OCR
权限管理 - 文字识别 OCR

cribe 取消开通通用文字识别服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers 为其余子用户开通通用文字识别服务 √ × ocr:g

帮助中心 > 文字识别 OCR > 用户指南 > 权限管理
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“多模板分

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

使用多模板分类工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在文字识别套件控制台选择“多模板分类工作流”新建应用，并上传模板图片，详情请见上传模板图片。定义预处理

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
使用多模板工作流开发应用 - 企业级AI应用开发专业套件 ModelArts Pro

一步”。进入“应用开发>框选识别区”页面。步骤6：框选识别区在“应用开发>框选识别区”页面，通过单击左上方操作图标，调整当前模板图片到合适大小。单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。识别区是对应字段内容所在区域。在框选

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 快速入门 > 文字识别套件
获取识别结果 - 文字识别 OCR
获取识别结果 - 文字识别 OCR

获取识别结果解读识别结果识别结果后处理

 帮助中心 > 文字识别 OCR > 用户指南
通用类 - 文字识别 OCR
通用类 - 文字识别 OCR

功能介绍通用表格识别提取表格内的文字和所在行列位置信息，适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化，恢复结构化信息。通用文字识别提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。手写文字识别识别文档中的手写文

 帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

对提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。

帮助中心 > 文字识别 OCR > API参考
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过

 帮助中心 > 文字识别 OCR > 用户指南
开始使用 - 文字识别 OCR
开始使用 - 文字识别 OCR

选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”，上传示例发票图片或者电子发票pdf文件。图2 上传待识别发票选择用于存放结果的“ocr-invoice-result-bucket”桶，即可自动获取该发票的识别与验真结果，以发票文件名称为前缀的JSON文件存储。

帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真 > 实施步骤
调用SDK实现通用表格识别 - 文字识别 OCR

调用SDK实现通用表格识别文字识别服务软件开发工具包（OCR SDK）是对文字识别服务提供的REST API进行的封装，以简化用户的开发工作。本章节以通用表格识别API为例，介绍如何使用OCR Python SDK。使用OCR SDK的详细步骤如下所示：步骤1：开通服务步骤2：安装SDK

帮助中心 > 文字识别 OCR > 快速入门
训练分类器 - 企业级AI应用开发专业套件 ModelArts Pro

训练分类器确定模板图片的参照字段和识别区后，多模板分类工作流在模板数量较多，或版式相似度较高的情况下，建议针对不同的模板上传对应的训练集数据，用于训练模板分类模型，使服务能够精准地分类多个模板图片，然后对多个模板图片进行文字识别和结构化提取。前提条件已在文字识别套件控制台选择“

帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
准备工作 - 文字识别 OCR
准备工作 - 文字识别 OCR

准备工作开通文字识别服务登录文字识别控制台。在控制台左上角选择区域为“北京四”，并开通“增值税发票识别”、“发票验真”。开通后，默认为按需计费。图1 开通管理完成文字识别对OBS服务授权。在文字识别控制台，选择“服务授权”，单击开通授权。图2 服务授权创建 rf_amdin_trust

帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真 > 实施步骤
查看应用详情 - 企业级AI应用开发专业套件 ModelArts Pro

Pro控制台查看应用详情，包括应用开发的配置信息和应用资产。前提条件已在文字识别套件控制台选择预置工作流新建应用，详情请见新建应用。进入应用详情页登录ModelArts Pro管理控制台，单击“文字识别”套件卡片的“进入套件”。进入文字识别套件控制台。在左侧导航栏选择“应用开发>工作台”。默认进入“我的应用”页签。

帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件
错误码 - 文字识别 OCR
错误码 - 文字识别 OCR

requirements. 图片尺寸不满足要求。请检查图片尺寸，各服务支持图片尺寸请参考使用限制。 AIS.0104 The image is not supported or the image quality is poor. 非支持的图片类型或图片质量差。请检查图片类型与图片质量。请检查调用的接口是否正确。

帮助中心 > 文字识别 OCR > API参考
部署服务 - 企业级AI应用开发专业套件 ModelArts Pro

部署服务评估模板应用后，就可以部署多模板应用至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。前提条件已在文字识别套件控制台选择“多模板分类工作流”新建应用，并完成评估模板步骤，详情请见评估应用。操作步骤在

 帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro

评估应用通过上传测试图片，在线评估模板分类情况和模板的文字识别情况，保证能在多个模板情况下正确分类测试图片的模板，并且能正确识别测试图片中的识别区文字。评估应用部署服务模板图片评估后，可以部署模板至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的多模板样式的图片。

帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 文字识别套件 > 多模板分类工作流
资源和成本规划 - 文字识别 OCR

该解决方案主要部署如下资源，需要的产品列表和配置示例如表1、表2所示，以下花费仅供参考。表1 产品配置说明产品配置示例文字识别服务区域：华北-北京四计费模式：按需计费涉及服务：增值税发票识别、发票验真对象存储服务区域：华北-北京四计费模式：按需计费存储策略：多AZ存储桶策略：私有存储类别：标准存储

 帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用单模板工作流开发应用 - 企业级AI应用开发专业套件 ModelArts Pro

行业套件介绍 - 企业级AI应用开发专业套件 ModelArts Pro

框选识别区 - 文字识别 OCR

权限管理 - 文字识别 OCR

框选识别区 - 文字识别 OCR

定义预处理 - 企业级AI应用开发专业套件 ModelArts Pro

使用多模板工作流开发应用 - 企业级AI应用开发专业套件 ModelArts Pro

获取识别结果 - 文字识别 OCR

通用类 - 文字识别 OCR

API概览 - 文字识别 OCR

准备数据 - 文字识别 OCR

开始使用 - 文字识别 OCR

调用SDK实现通用表格识别 - 文字识别 OCR

训练分类器 - 企业级AI应用开发专业套件 ModelArts Pro

准备工作 - 文字识别 OCR

查看应用详情 - 企业级AI应用开发专业套件 ModelArts Pro

错误码 - 文字识别 OCR

部署服务 - 企业级AI应用开发专业套件 ModelArts Pro

工作流介绍 - 企业级AI应用开发专业套件 ModelArts Pro

资源和成本规划 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线