搜索_华为云

文字识别SDK简介 - 文字识别 OCR

文字识别SDK简介文字识别SDK概述文字识别（Optical Character Recognition，简称OCR）将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入，提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。文字识别以开放API（Application

帮助中心 > 文字识别 OCR > SDK参考
文字识别 - 文字识别 OCR
文字识别 - 文字识别 OCR

产品介绍在线体验图说ECS 立即使用成长地图由浅入深，带您玩转OCR 01 了解了解华为云文字识别服务的产品介绍、应用场景、使用限制，有助于更好的使用文字识别服务。产品介绍什么是文字识别应用场景展示使用限制说明智能分类介绍 03 入门文字识别服务以开放API（Application

帮助中心 > 文字识别 OCR > 成长地图
行驶证识别 - 文字识别 OCR
行驶证识别 - 文字识别 OCR

该参数与image二选一。图片大小不超过10MB，图片的url路径目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API
什么是文字识别 - 文字识别 OCR

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。文字识别服务等级协议请参见华为云服务等级协议。

帮助中心 > 文字识别 OCR > 产品介绍
文字识别 OCR - 文字识别 OCR
文字识别 OCR - 文字识别 OCR

低人工录入成本。支持区域：华北-北京四通用文字识别API 网络图片识别支持识别网络图片中的所有印刷体、艺术字等文字信息，可识别中英文及部分繁体字以及常见网络图片如：手机截图、电脑截图、电商产品图及广告设计图等互联网图片，能够返回位置坐标和置信度，方便用户进行版式的二次处理

 帮助中心 > 文字识别 OCR > 功能总览
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返

 帮助中心 > 文字识别 OCR > API参考
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“多模板分

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

在使用单模板工作流开发应用之前，需要上传模板图片，明确以哪张图片作为模板训练文字识别模型。上传模板图片定义预处理上传模板图片后，需要对模板图片进行预处理，去掉冗余部分，将图片旋转至水平，保证模型识别的准确性。定义预处理框选参照字段在图片模板中框选参照字段，用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
OCR服务可以识别文本格式文件吗 - 文字识别 OCR

增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件，可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
如何选取参照字段？ - 文字识别 OCR

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
使用流程简介 - 文字识别 OCR
使用流程简介 - 文字识别 OCR

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明。文字识别服务等级协议请参见华为云服务等级协议。

帮助中心 > 文字识别 OCR > 用户指南
通用类 - 文字识别 OCR
通用类 - 文字识别 OCR

通用表格识别提取表格内的文字和所在行列位置信息，适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化，恢复结构化信息。通用文字识别提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。手写文字识别识别文档中的手写文字信息，并将识别的结构化结果返回给用户。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
不动产证识别 - 文字识别 OCR
不动产证识别 - 文字识别 OCR

与image二选一。图片大小不超过10MB，图片的URL路径目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。响应参数

 帮助中心 > 文字识别 OCR > API参考 > API
财务报表识别 - 文字识别 OCR
财务报表识别 - 文字识别 OCR

与image二选一。图片大小不超过10MB，图片的URL路径目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API
名片识别 - 文字识别 OCR
名片识别 - 文字识别 OCR

请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度，可选值如下。 true：校正图片的倾斜角度 false：不校正图片的倾斜角度

 帮助中心 > 文字识别 OCR > API参考 > API
票据类 - 文字识别 OCR
票据类 - 文字识别 OCR

功能介绍增值税发票识别通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。机动车销售发票识别自动识别机动车销售发票图片内的文本内容，并返回结构化字段信息，

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。：单击图标，在“图片旋转”窗口，鼠标选中调整图片的方向，然后单击“确认”，调整图片的方向。：单击图标，向左旋转图片90°。：单击图标，向右旋转图片90°。：单击图标，缩小图片大小。：单击图标，放大图片大小。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
保险单识别 - 文字识别 OCR
保险单识别 - 文字识别 OCR

请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度，可选值如下。 true：校正图片的倾斜角度 false：不校正图片的倾斜角度

 帮助中心 > 文字识别 OCR > API参考 > API
驾驶证识别 - 文字识别 OCR
驾驶证识别 - 文字识别 OCR

该参数与image二选一。图片大小不超过10MB，图片的url路径目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API

总条数： 271

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文字识别SDK简介 - 文字识别 OCR

文字识别 - 文字识别 OCR

行驶证识别 - 文字识别 OCR

什么是文字识别 - 文字识别 OCR

文字识别 OCR - 文字识别 OCR

API概览 - 文字识别 OCR

框选识别区 - 文字识别 OCR

框选识别区 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

OCR服务可以识别文本格式文件吗 - 文字识别 OCR

如何选取参照字段？ - 文字识别 OCR

使用流程简介 - 文字识别 OCR

通用类 - 文字识别 OCR

不动产证识别 - 文字识别 OCR

财务报表识别 - 文字识别 OCR

名片识别 - 文字识别 OCR

票据类 - 文字识别 OCR

定义预处理 - 文字识别 OCR

保险单识别 - 文字识别 OCR

驾驶证识别 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线