搜索_华为云

什么是文字识别 - 文字识别 OCR

什么是文字识别文字识别（Optical Character Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming I

帮助中心 > 文字识别 OCR > 产品介绍
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

准备数据数据要求受技术与成本多种因素制约，文字识别服务存在一些约束限制。以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。

帮助中心 > 文字识别 OCR > 用户指南
成本管理 - 文字识别 OCR
成本管理 - 文字识别 OCR

成本管理随着上云企业越来越多，企业对用云成本问题也越发重视。使用文字识别服务OCR时，如何进行成本管理，减轻业务负担呢？本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理，帮助您通过成本管理节约成本，在保障业务快速发展的同时获得最大成本收益。成本构成使用文字

 帮助中心 > 文字识别 OCR > 计费说明
如何选购合适的API - 文字识别 OCR

如何选购合适的API 文字识别服务（OCR）提供四种类型的API：通用类、证件类、票据类、智能分类。除此之外，您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。通用类通用表格识别：提取表格内的文字和所在行列位置信息。通用文字识别：提取图片内的文字及其对应位置信息。

帮助中心 > 文字识别 OCR > 常见问题 > 服务开通类
智能分类 - 文字识别 OCR
智能分类 - 文字识别 OCR

智能分类功能介绍智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别，并返回每个卡证、票据的类别及结构化数据。应用场景智能分类识别服务应用在身份认证、财务报销等多种场景，使用方便，有效提升数据录入效率。场景一：卡证、发票混合识别场景二：相同类型发票识别

 帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
自定义OCR介绍 - 文字识别 OCR
自定义OCR介绍 - 文字识别 OCR

自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线，为避免影响您目前的业务，请您及时进行相关迁移工作，迁移指导详见OCR自定义模板下线公告。自定义OCR基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR
权限管理 - 文字识别 OCR
权限管理 - 文字识别 OCR

权限管理如果您需要对华为云上购买的OCR资源，为企业中的员工设置不同的访问权限，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功

 帮助中心 > 文字识别 OCR > 用户指南 > 权限管理
错误码 - 文字识别 OCR
错误码 - 文字识别 OCR

错误码调用接口出错后，将不会返回结果数据。调用方可根据每个接口对应的错误码来定位错误原因。当调用出错时，HTTPS请求返回一个 4xx 或 5xx 的 HTTPS状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系华为云客服技术支持，并提供错误码，以便尽快帮您解决问题。

帮助中心 > 文字识别 OCR > API参考
银行回单识别 - 文字识别 OCR
银行回单识别 - 文字识别 OCR

银行回单识别功能介绍支持对银行回单版式进行文字识别及键值对提取，实现高效的自动化结构化返回。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。约束与限制支持JPEG、JPG、PNG、BMP、TIFF、PDF格式，多页PDF默认识别第一页。图像

 帮助中心 > 文字识别 OCR > API参考 > API
户口本识别 - 文字识别 OCR
户口本识别 - 文字识别 OCR

户口本识别功能介绍识别户口本中的文字信息，并返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

帮助中心 > 文字识别 OCR > API参考 > API
车辆合格证识别 - 文字识别 OCR

车辆合格证识别功能介绍识别车辆合格证中的文字信息，并返回识别的结构化结果。约束与限制只支持中国大陆车辆合格证的识别。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。图像中识别区域有效占比超过80%，保证整张车辆合格证内容及其边缘包含在图像内。

帮助中心 > 文字识别 OCR > API参考 > API
承兑汇票识别 - 文字识别 OCR
承兑汇票识别 - 文字识别 OCR

承兑汇票识别功能介绍识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。约束与限制只支持中英文。只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。图像各边的像素大小在15px到8192px之间。图像

 帮助中心 > 文字识别 OCR > API参考 > API
增值税发票识别 - 文字识别 OCR

增值税发票识别功能介绍识别增值税发票的类别，并以JSON格式返回识别的结构化结果，支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。发票验真API请参见发票验真。图1 增值税发票示例图图2 区块链发票示例图图3

帮助中心 > 文字识别 OCR > API参考 > API
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

智能文档解析功能介绍对证件、票据、表单等任意版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务，并以json格式返回识别的结构化结果。约束与限制支持中英文及部分中文繁体字。只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、

帮助中心 > 文字识别 OCR > API参考 > API
自定义模板OCR - 文字识别 OCR
自定义模板OCR - 文字识别 OCR

自定义模板OCR OCR自定义模板将于2025.12.31正式下线，为避免影响您目前的业务，请您及时进行相关迁移工作，迁移指导详见OCR自定义模板下线公告。功能介绍自定义模板OCR，支持用户自定义模板，对于版式固定的各种票据和卡证，通过可视化界面操作，指定需要识别的关键字段，

帮助中心 > 文字识别 OCR > API参考 > API

总条数： 95

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是文字识别 - 文字识别 OCR

准备数据 - 文字识别 OCR

成本管理 - 文字识别 OCR

如何选购合适的API - 文字识别 OCR

智能分类 - 文字识别 OCR

自定义OCR介绍 - 文字识别 OCR

权限管理 - 文字识别 OCR

错误码 - 文字识别 OCR

银行回单识别 - 文字识别 OCR

户口本识别 - 文字识别 OCR

车辆合格证识别 - 文字识别 OCR

承兑汇票识别 - 文字识别 OCR

增值税发票识别 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

自定义模板OCR - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线