搜索_华为云

OCR服务支持上传图片后直接导出结果吗 - 文字识别 OCR

OCR服务支持上传图片后直接导出结果吗目前OCR服务不支持上传图片后直接导出结果，需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
上传模板图片 - 文字识别 OCR
上传模板图片 - 文字识别 OCR

应用开发上传模板图片在“应用开发>上传模板图片”页面，配置如下信息：图2 上传模板图片 “模板名称”：输入模板名称。 “语种”：单击图片上方“语种”下拉选择框，选择模板对应的语种。不选择的情况下，默认为中英文。 “上传图片”：单击“上传图片”区域，或鼠标直接拖拽图片至“上传图

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
上传模板图片 - 文字识别 OCR
上传模板图片 - 文字识别 OCR

在“应用开发>上传模板图片”页面，输入多模板分类器的“名称”和“描述”。图3 上传模板图片然后上传模板图片，可选择新增模板配置。新增模板配置新增模板配置默认进入“新增模板配置”页签。图4 新增模板配置单击添加多个模板，针对每个模板，选择模板类型，并且上传图片。 “上传图片”

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
pdf转图片方法 - 文字识别 OCR
pdf转图片方法 - 文字识别 OCR

pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg:

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
网络图片识别 - 文字识别 OCR
网络图片识别 - 文字识别 OCR

P、ICO、PCX、GIF格式图片。支持常见网络图片：手机截图、电脑截图、电商产品图及广告设计图等互联网图片。图像各边的像素大小在15px到30000px之间。图像中有效文字图片占比超过60%，避免有效文字图片占比过小。支持图像中有效文字图片的任意角度的水平旋转（需开启方向检测）。

帮助中心 > 文字识别 OCR > API参考 > API
如何获取图片base64编码 - 文字识别 OCR

如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码，本节以Python为例，介绍如何将本地图片，转换为base64编码。您也可以使用在线的图片转base64工具。使用时，需要将代码的d:\demo.jpg替换为实际图片路径。 import base64

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
图片质量类报错处理办法 - 文字识别 OCR

图片质量类报错处理办法问题现象调用文字识别API时，产生以下图片质量类报错。错误码AIS.0102：图片格式不支持。错误码AIS.0103：图片尺寸不满足要求。错误码AIS.0104：非支持的图片类型或图片质量差。解决方法请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。

帮助中心 > 文字识别 OCR > 常见问题 > 错误码类
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

使用通用单模板工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在自定义OCR控制台选择“通用单模板工作流”创建应用，并上传模板图片，详情请见上传模板图片。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
定义预处理 - 文字识别 OCR
定义预处理 - 文字识别 OCR

使用多模板分类工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。前提条件已在自定义OCR控制台选择“多模板分类工作流”创建应用，并上传模板图片，详情请见上传模板图片。定义预处理

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
使用OCR服务是否必须使用华为云存储图片 - 文字识别 OCR

使用OCR服务是否必须使用华为云存储图片文字识别服务支持输入图片的base64编码或图片的url路径。如果您使用图片的url路径，可以将图片上传至华为云对象存储服务（OBS）中，使用OBS提供的图片url。关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用O

帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
电子面单识别 - 文字识别 OCR
电子面单识别 - 文字识别 OCR

售公告。功能介绍识别用户上传的电子面单图片中的文字内容，并将识别的结果以JSON格式返回给用户。图1 电子面单示例图约束与限制电子面单支持的版式以样例为准。支持识别JPG、PNG、BMP、TIFF格式图片。图像各边的像素大小在15px到8192px之间。调用方法请参见如何调用API。

帮助中心 > 文字识别 OCR > API参考 > API
如何提高识别速度 - 文字识别 OCR

如何提高识别速度识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
是否支持从非华为云存储中读取图片 - 文字识别 OCR

是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址，如果使用非华为云存储，请确保相应的图片可以通过公网进行访问。父主题： API使用类

 帮助中心 > 文字识别 OCR > 常见问题 > API使用类
开始使用 - 文字识别 OCR
开始使用 - 文字识别 OCR

登录华为云对象存储服务控制台，查看部署完成后，自动创建的OBS桶列表。图1 对象存储服务控制台选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”，上传示例发票图片或者电子发票pdf文件。图2 上传待识别发票选择用于存放结果的“ocr-invoice-result-

帮助中心 > 文字识别 OCR > 最佳实践 > 发票识别与验真 > 实施步骤
使用流程简介 - 文字识别 OCR
使用流程简介 - 文字识别 OCR

文字识别是指对图像中的打印字符进行检测识别，通过调用API，识别图片中的文字，并返回JSON格式的识别结果。使用流程图1 使用流程使用前必读用户需要具备编程能力，熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口，将图片或扫描件中的文字识别成可编

 帮助中心 > 文字识别 OCR > 用户指南
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

在文字识别过程中，套件会检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。基本概念参照

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

在识别文字的过程中，套件会先对图片进行模板分类，再检查所识别图片与模板图片是否为同一种模板，并将识别图片校正后再提取结构化信息，支持图片平移、旋转与拉伸变换。为了正确分类并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板，最后通过参照字段的位置来校正待识别图片。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
评估 - 文字识别 OCR
评估 - 文字识别 OCR

选择本地上传测试图片或者上传在线图片，评估模板。图4 评估模板本地上传图片默认进入“本地上传”页签，单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。上传图片后，右侧会显示文字识别结果，包括“识别区”和对应的“识别结果”。上传在线图片

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
评估 - 文字识别 OCR
评估 - 文字识别 OCR

次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤，单击“下一步”，进入“评估”页面。本地上传图片图2 评估模板在“应用开发>评估”页面，默认进入“本地上传”页签。单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
财务报表识别 - 文字识别 OCR
财务报表识别 - 文字识别 OCR

财务报表识别功能介绍识别用户上传的表格图片中的文字内容，并将识别的结果返回给用户。约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过80%，保证整张表格及其边缘包含在图像内。

帮助中心 > 文字识别 OCR > API参考 > API

总条数： 138

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OCR服务支持上传图片后直接导出结果吗 - 文字识别 OCR

上传模板图片 - 文字识别 OCR

上传模板图片 - 文字识别 OCR

pdf转图片方法 - 文字识别 OCR

网络图片识别 - 文字识别 OCR

如何获取图片base64编码 - 文字识别 OCR

图片质量类报错处理办法 - 文字识别 OCR

定义预处理 - 文字识别 OCR

定义预处理 - 文字识别 OCR

使用OCR服务是否必须使用华为云存储图片 - 文字识别 OCR

电子面单识别 - 文字识别 OCR

如何提高识别速度 - 文字识别 OCR

是否支持从非华为云存储中读取图片 - 文字识别 OCR

开始使用 - 文字识别 OCR

使用流程简介 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

评估 - 文字识别 OCR

评估 - 文字识别 OCR

财务报表识别 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线