搜索_华为云

工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

在“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应用，详细操作请见创建应用。您可以创建多模板服务，通过多模板训练模板分类模型和文字识别模型，实现多模板图像的文字信息结构化提取。图1 创建多模板流程表1 创建多模板流程说明流程说明详细指导上传模板图片在使用多模板工作流开发应用之前

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。基本概念参照字段为模板图片和待

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

通用单模板工作流”创建应用，详细操作请见6.2 新建应用。您可以创建单模板服务，通过模板配置文字识别模型，实现单模板图像的文字信息结构化提取。图1 创建单模板流程表1 创建单模板流程说明流程说明详细指导上传模板图片在使用单模板工作流开发应用之前，需要上传模板图片，明确以哪张图片作为模板训练文字识别模型。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模板工作流”创建应用，并框选参照字段，详情请见框选参照字段。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

详情请见框选参照字段。操作步骤图1 多模板框选识别区在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板，对每个模板图片进行预处理。单击左上方操作图标，调整当前模板图片到合适大小。单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
什么情况下可以使用自定义模板？ - 文字识别 OCR

别API，则可以利用自定义模板打造出毕业证书识别接口，提取毕业证上的文字信息。自定义模板支持识别单模板应用或是多模板应用，单模板仅支持一种版式，多模板支持识别多种版式。单模板的前提：识别图片需与模板图片版式相同，具体而言，图片中要存在文字内容和位置均固定不变的文字（参照字段）。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
什么是文字识别 - 文字识别 OCR

什么是文字识别文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming I

帮助中心 > 文字识别 OCR > 产品介绍
自定义OCR介绍 - 文字识别 OCR
自定义OCR介绍 - 文字识别 OCR

开发应用通用单模板工作流根据工作流指引，创建单模板服务，通过模板训练文字识别模型，实现单模板图像的文字信息结构化提取。通用单模板工作流多模板分类工作流根据工作流指引，创建多模板服务，通过多模板训练模板分类器和文字识别模型，实现多模板图像的文字信息结构化提取。多模板分类工作流

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR
如何选取参照字段？ - 文字识别 OCR

参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不满足此要求，可能会提取到错误的识别结果，或是返回AIS.0119（输入图片与模板匹配失败）、AIS

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
OCR自定义策略 - 文字识别 OCR
OCR自定义策略 - 文字识别 OCR

可视化视图创建自定义策略：无需了解策略语法，按可视化视图导航栏选择云服务、操作、资源、条件等策略内容，可自动生成策略。 JSON视图创建自定义策略：可以在选择策略模板后，根据具体需求编辑策略内容；也可以直接在编辑框内编写JSON格式的策略内容。具体创建步骤请参见：创建自定义策略。父主题：权限管理

 帮助中心 > 文字识别 OCR > 用户指南 > 权限管理
证件类 - 文字识别 OCR
证件类 - 文字识别 OCR

证件类功能介绍身份证识别自动识别身份证上的全部信息，支持身份证正反面识别，一次扫描即可识别身份证号码、姓名、地址等全部信息。户口本识别自动识别居民户口本户主页及成员页，并返回部分关键字段信息。驾驶证识别自动识别驾驶证正页与副页上的全部信息，自动提取出姓名、性别、领证

 帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
文字识别SDK简介 - 文字识别 OCR

文字识别SDK简介文字识别SDK概述文字识别（Optical Character Recognition，简称OCR）将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入，提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。文字识别以开放API（Application

帮助中心 > 文字识别 OCR > SDK参考
OCR服务使用简介 - 文字识别 OCR

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序

 帮助中心 > 文字识别 OCR > 快速入门
概述 - 文字识别 OCR
概述 - 文字识别 OCR

概述文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming Interf

帮助中心 > 文字识别 OCR > API参考 > 使用前必读
识别结果容易漏字或多识别出内容怎么办？ - 文字识别 OCR

若结果漏字，可能是由于识别区太小导致的，需在相应模板的"框选识别区"页面，把漏字的识别区调大一些。若多识别出文字，可能是识别区太大，将周边无关的文字也框进来了，需将识别区改小一点。若上述办法均无法解决，请检查识别区的文字是否发生了偏移，或者识别图片是否跟模板属于相同版式。父主题：常见问题

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
使用流程简介 - 文字识别 OCR
使用流程简介 - 文字识别 OCR

用户需要具备编程能力，熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

帮助中心 > 文字识别 OCR > 用户指南
通用文字识别 - 文字识别 OCR
通用文字识别 - 文字识别 OCR

通用文字识别功能介绍识别图片上的文字信息，以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 通用文字示例图约束与限制

 帮助中心 > 文字识别 OCR > API参考 > API
保险单识别 - 文字识别 OCR
保险单识别 - 文字识别 OCR

保险单识别功能介绍识别保险单图片上的文字信息，并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素在15px到8192px之间。图像中保险单区域

 帮助中心 > 文字识别 OCR > API参考 > API
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

保险单识别识别保险单图片上的文字信息，并将识别的结构化结果返回给用户。支持对多板式保险单的扫描图片及手机照片进行结构化信息提取。自定义模板自定义模板OCR 自定义模板OCR，支持用户自定义模板，对于版式固定的各种票据和卡证，通过可视化界面操作，指定需要识别的关键字段，实现用户特定格式图片的自动识别和结构化提取。

帮助中心 > 文字识别 OCR > API参考
票据类 - 文字识别 OCR
票据类 - 文字识别 OCR

自动识别飞机行程单的全部信息，一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。定额发票识别自动识别定额发票的全部信息，一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。火车票识别自动识别火车票的全部信息，一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍

总条数： 91

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作流介绍 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

框选识别区 - 文字识别 OCR

框选识别区 - 文字识别 OCR

什么情况下可以使用自定义模板？ - 文字识别 OCR

什么是文字识别 - 文字识别 OCR

自定义OCR介绍 - 文字识别 OCR

如何选取参照字段？ - 文字识别 OCR

OCR自定义策略 - 文字识别 OCR

证件类 - 文字识别 OCR

文字识别SDK简介 - 文字识别 OCR

OCR服务使用简介 - 文字识别 OCR

概述 - 文字识别 OCR

识别结果容易漏字或多识别出内容怎么办？ - 文字识别 OCR

使用流程简介 - 文字识别 OCR

通用文字识别 - 文字识别 OCR

保险单识别 - 文字识别 OCR

API概览 - 文字识别 OCR

票据类 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线