搜索_华为云

文字识别SDK简介 - 文字识别 OCR

文字识别（Optical Character Recognition，简称OCR）将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入，提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。文字识别以开放API（Application Programming

帮助中心 > 文字识别 OCR > SDK参考
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

与data二选一。图片或PDF的URL路径，目前支持：公网http/https url OBS提供的url，使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。说明：接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。

帮助中心 > 文字识别 OCR > API参考 > API
评估 - 文字识别 OCR
评估 - 文字识别 OCR

认评估状态为端到端地对待识别图片自动分类并进行结构化识别。上传在线图片单击“在线URL”，切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址，或者拖拽测试图片至虚线框内上传图片区域，上传在线图片作为测试图片。上传图片后，右侧会显示模板识别结果，包

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
评估 - 文字识别 OCR
评估 - 文字识别 OCR

传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤，单击“下一步”，进入“评估”页面。本地上传图片图2 评估模板在“应用开发>评估”页面，默认进入“本地上传”页签。单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。测试图片上传成功后，右侧会显示识别结果。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。：单击图标，在“图片旋转”窗口，鼠标选中调整图片的方向，然后单击“确认”，调整图片的方向。：单击图标，向左旋转图片90°。：单击图标，向右旋转图片90°。：单击图标，缩小图片大小。：单击图标，放大图片大小。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

在识别文字的过程中，套件会先对图片进行模板分类，再检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了正确分类并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板，最后通过参照字段的位置来校正待识别图片。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。基本概念参照

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
如何提高识别速度 - 文字识别 OCR

如何提高识别速度识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。：单击图标，在“图片旋转”窗口，鼠标选中调整图片的方向，然后单击“确认”，调整图片的方向。：单击图标，向左旋转图片90°。：单击图标，向右旋转图片90°。：单击图标，缩小图片大小。：单击图标，放大图片大小。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
如何提高识别精度 - 文字识别 OCR

如何提高识别精度尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平

 帮助中心 > 文字识别 OCR > 常见问题 > API使用类
接口返回时间较长，如何提高响应速度 - 文字识别 OCR

接口返回时间较长，如何提高响应速度请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长，建议在不改变图片质量的情况下对图片进行等比例缩放。检查网络带宽是否稳定，是否存在网络波动，建议提升网络带宽避免网络时延较长。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
文字识别 OCR - 文字识别 OCR
文字识别 OCR - 文字识别 OCR

车辆通行费发票识别飞机行程单识别电子面单识别保险单识别财务报表识别道路运输从业资格证识别通用表格识别支持对图片中的所有表格文字信息进行识别和提取，可识别常规表格及合并单元格表格中的中英文和部分繁体字。能够返回文本块坐标及单元格坐标信息，方便用户进行版式的二次处理以及提高人工校验效率。

帮助中心 > 文字识别 OCR > 功能总览
OCR服务能否实时处理视频流中的文字 - 文字识别 OCR

OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据，您可将视频流进行提取帧图片操作，提取出图片后进行识别。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返回

 帮助中心 > 文字识别 OCR > API参考
约束与限制 - 文字识别 OCR
约束与限制 - 文字识别 OCR

发请求，请提前联系我们。网络图片识别支持中英文及部分中文繁体字。只支持识别JPG、JPEG、PNG、BMP、TIFF、TGA、WEBP、ICO、PCX、GIF格式图片。支持常见网络图片如：手机截图、电脑截图、电商产品图及广告设计图等互联网图片。图像各边的像素大小在15到8192px之间。

帮助中心 > 文字识别 OCR > 产品介绍
OCR服务支持批量识别吗 - 文字识别 OCR

OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片，批量识别需要进行二次开发，编码循环调用API，实现批量调用服务识别图片。父主题： API使用类

 帮助中心 > 文字识别 OCR > 常见问题 > API使用类
OCR服务使用简介 - 文字识别 OCR

服务开通后，您可以根据以下介绍选择合适的使用方式：通过OCR体验馆在线调用OCR服务API。如果您没有开发基础，想快速体验OCR服务，OCR体验馆提供了在线网页调用方式，该方式无需编码，直接在网页上传图片，即可返回识别结果。通过华为云API Explorer在线调用OCR服务API。如果您是开发初学

 帮助中心 > 文字识别 OCR > 快速入门
无权在控制台服务监控查看数据 - 文字识别 OCR

务，或者授予权限即可，具体操作如下：登录主账号，进入控制台后，为此IAM用户开通对应的服务（如：通用表格），此用户就会有权限查看服务监控中通用表格的数据。图2 开通通用表格图3 服务监控主账号需要给此用户授予admin/Full Access权限。操作如下：登录主账号，

帮助中心 > 文字识别 OCR > 常见问题 > 权限类
行驶证识别 - 文字识别 OCR
行驶证识别 - 文字识别 OCR

image 否 String 该参数与url二选一。图片的Base64编码，要求Base64编码后大小不超过10MB。图片最短边不小于100px，最长边不超过8000px。支持JPEG、JPG、PNG、BMP、TIFF格式。图片Base64编码示例如/9j/4AAQSkZJRgABAg

帮助中心 > 文字识别 OCR > API参考 > API
名片识别 - 文字识别 OCR
名片识别 - 文字识别 OCR

请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度，可选值如下。 true：校正图片的倾斜角度 false：不校正图片的倾斜角度

 帮助中心 > 文字识别 OCR > API参考 > API

总条数： 170

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文字识别SDK简介 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

评估 - 文字识别 OCR

评估 - 文字识别 OCR

定义预处理 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

如何提高识别速度 - 文字识别 OCR

定义预处理 - 文字识别 OCR

如何提高识别精度 - 文字识别 OCR

接口返回时间较长，如何提高响应速度 - 文字识别 OCR

文字识别 OCR - 文字识别 OCR

OCR服务能否实时处理视频流中的文字 - 文字识别 OCR

API概览 - 文字识别 OCR

约束与限制 - 文字识别 OCR

OCR服务支持批量识别吗 - 文字识别 OCR

OCR服务使用简介 - 文字识别 OCR

无权在控制台服务监控查看数据 - 文字识别 OCR

行驶证识别 - 文字识别 OCR

名片识别 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线