搜索_华为云

如何提高识别速度 - 文字识别 OCR

如何提高识别速度识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
在线调试 - 文字识别 OCR
在线调试 - 文字识别 OCR

在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时，集成开发环境CloudIDE，可完成代码的构建、调试、运行。本章节以通用文字识别为例，介绍如何使用API Explorer调试API。前提条件注册华为账号并开通华为云，并完成实名认

 帮助中心 > 文字识别 OCR > 用户指南 > 调用API或SDK
评估 - 文字识别 OCR
评估 - 文字识别 OCR

传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤，单击“下一步”，进入“评估”页面。本地上传图片图2 评估模板在“应用开发>评估”页面，默认进入“本地上传”页签。单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。测试图片上传成功后，右侧会显示识别结果。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

框选参照字段在识别文字的过程中，套件会先对图片进行模板分类，再检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了正确分类并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
OCR服务可以识别文本格式文件吗 - 文字识别 OCR

增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件，可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
手写文字识别 - 文字识别 OCR
手写文字识别 - 文字识别 OCR

接口响应时间依赖于图片的下载时间，如果图片下载时间过长，会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 quick_mode 否 Boolean 快速模式开关，针对单行文字图片（要求

 帮助中心 > 文字识别 OCR > API参考 > API
名片识别 - 文字识别 OCR
名片识别 - 文字识别 OCR

请保证被检测图片所在的存储服务稳定可靠，推荐使用OBS服务存储图片数据。 url中不能存在中文字符，若存在，中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度，可选值如下。 true：校正图片的倾斜角度 false：不校正图片的倾斜角度

 帮助中心 > 文字识别 OCR > API参考 > API
行驶证识别 - 文字识别 OCR
行驶证识别 - 文字识别 OCR

return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括： true：返回各个文字块区域 false：不返回各个文字块区域如果无该参数，系统默认不返回文字块区域。如果输入参数不是Boolean类型，则会报非法参数错误。响应参数

 帮助中心 > 文字识别 OCR > API参考 > API
API概览 - 文字识别 OCR
API概览 - 文字识别 OCR

对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务，实现进阶高效的自动化结构化返回。通用类通用表格识别识别表格图片上的文字内容，并返回识别的结构化结果。通用文字识别识别图片上的文字内容，并返回识别的文字和坐标。网络图片识别识别网络图片中的文字内容，并以JSON格式返

 帮助中心 > 文字识别 OCR > API参考
使用流程简介 - 文字识别 OCR
使用流程简介 - 文字识别 OCR

OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。关于文字识别的相关声明请参见文字识别服务声明。文字识别服务等级协议请参见华为云服务等级协议。

帮助中心 > 文字识别 OCR > 用户指南
OCR服务能否实时处理视频流中的文字 - 文字识别 OCR

OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据，您可将视频流进行提取帧图片操作，提取出图片后进行识别。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“多模板分

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
工作流介绍 - 文字识别 OCR
工作流介绍 - 文字识别 OCR

在使用单模板工作流开发应用之前，需要上传模板图片，明确以哪张图片作为模板训练文字识别模型。上传模板图片定义预处理上传模板图片后，需要对模板图片进行预处理，去掉冗余部分，将图片旋转至水平，保证模型识别的准确性。定义预处理框选参照字段在图片模板中框选参照字段，用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
票据类 - 文字识别 OCR
票据类 - 文字识别 OCR

功能介绍增值税发票识别通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。机动车销售发票识别自动识别机动车销售发票图片内的文本内容，并返回结构化字段信息，

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
通用类 - 文字识别 OCR
通用类 - 文字识别 OCR

通用表格识别提取表格内的文字和所在行列位置信息，适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化，恢复结构化信息。通用文字识别提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。手写文字识别识别文档中的手写文字信息，并将识别的结构化结果返回给用户。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
财务报表识别 - 文字识别 OCR
财务报表识别 - 文字识别 OCR

Float 检测到的文字块数目。对文本区，文字块以文本字段为单位；对表格区，文字块以单元格内所有字段为单位。 table_location Array<Array<Integer>> 表格位置信息，列表形式，分别表示表格4个顶点的x, y坐标;坐标原点为图片左上角，x轴沿水平方向，y轴沿竖直方向。

帮助中心 > 文字识别 OCR > API参考 > API
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。支持图像任意角度的水平旋转。目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文字识别。数据传入方式使用OCR API或SDK时，数据主要通过以下两种方法传入。 image 传入图片的base64编码。您可以通过在线转码工具

 帮助中心 > 文字识别 OCR > 用户指南
如何选取参照字段？ - 文字识别 OCR

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
约束与限制 - 文字识别 OCR
约束与限制 - 文字识别 OCR

支持常见网络图片如：手机截图、电脑截图、电商产品图及广告设计图等互联网图片。图像各边的像素大小在15到30000px之间。图像中有效文字图片占比超过60%，避免有效文字图片占比过小。支持图像中有效文字图片的任意角度的水平旋转（需开启方向检测）。文字识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。

帮助中心 > 文字识别 OCR > 产品介绍

总条数： 271

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何提高识别速度 - 文字识别 OCR

在线调试 - 文字识别 OCR

评估 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

OCR服务可以识别文本格式文件吗 - 文字识别 OCR

手写文字识别 - 文字识别 OCR

名片识别 - 文字识别 OCR

行驶证识别 - 文字识别 OCR

API概览 - 文字识别 OCR

使用流程简介 - 文字识别 OCR

OCR服务能否实时处理视频流中的文字 - 文字识别 OCR

框选识别区 - 文字识别 OCR

框选识别区 - 文字识别 OCR

工作流介绍 - 文字识别 OCR

票据类 - 文字识别 OCR

通用类 - 文字识别 OCR

财务报表识别 - 文字识别 OCR

准备数据 - 文字识别 OCR

如何选取参照字段？ - 文字识别 OCR

约束与限制 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线