搜索_华为云

OCR服务可以识别文本格式文件吗 - 文字识别 OCR

OCR服务可以识别文本格式文件吗增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件，可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。父主题：产品咨询类

 帮助中心 > 文字识别 OCR > 常见问题 > 产品咨询类
不同区域是否有时延 - 文字识别 OCR

区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方

 帮助中心 > 文字识别 OCR > 常见问题 > 区域与可用区
通用类 - 文字识别 OCR
通用类 - 文字识别 OCR

通用表格识别提取表格内的文字和所在行列位置信息，适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化，恢复结构化信息。通用文字识别提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。手写文字识别识别文档中的手写文字信息，并将识别的结构化结果返回给用户。

帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
通用文字识别 - 文字识别 OCR
通用文字识别 - 文字识别 OCR

携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。表3 请求Body参数

 帮助中心 > 文字识别 OCR > API参考 > API
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“通用单模板

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
框选识别区 - 文字识别 OCR
框选识别区 - 文字识别 OCR

框选识别区在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。前提条件已在自定义OCR控制台选择“多模板分类

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
区域与可用区 - 文字识别 OCR
区域与可用区 - 文字识别 OCR

能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。区域和终端节点当您通过API使用资源时，您必须指定其区域终端节点。有关区域和终端节点的更多信息，请参阅文字识别服务的地区和终端节点。

帮助中心 > 文字识别 OCR > 常见问题 > 区域与可用区
财务报表识别 - 文字识别 OCR
财务报表识别 - 文字识别 OCR

String 表格图像转换为excel的Base64编码，图像中的文字和表格按位置写入excel，可编辑。对返回的excel编码，可用base64.b64decode解码并保存为xlsx文件。 image_size image_size object 矫正后图像的高宽信息。 rectification_matrix

帮助中心 > 文字识别 OCR > API参考 > API
如何选取参照字段？ - 文字识别 OCR

如何选取参照字段？参照字段是在所有图片中，文字位置和内容均不发生变化的文字。参照字段有两个作用：在单模板应用中，用于矫正识别图片，从而找准识别字段；在多模板应用中，参照字段的内容和位置将作为相应模板的分类特征。在框选参照字段时，首先要确保所框选的文字位置和内容都固定不变，如果不满足此要

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
如何获取图片base64编码 - 文字识别 OCR

运行时请确保文件路径 d:/demo.jpg 是正确的，并且文件确实存在于此路径下。部分 Windows 环境下字符编码的默认设置可能与代码不兼容，导致读取后的解码报错。这种情况下可以尝试将代码中的decode()修改为decode('utf-8')来匹配适合的字符编码。图1

帮助中心 > 文字识别 OCR > 常见问题 > API使用类
识别结果容易漏字或多识别出内容怎么办？ - 文字识别 OCR

识别结果是根据识别区来进行提取的，识别区的位置和大小均会影响识别结果。若结果漏字，可能是由于识别区太小导致的，需在相应模板的"框选识别区"页面，把漏字的识别区调大一些。若多识别出文字，可能是识别区太大，将周边无关的文字也框进来了，需将识别区改小一点。若上述办法均无法解决，请检查识别区的文字是否发

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
泰国车牌识别 - 文字识别 OCR
泰国车牌识别 - 文字识别 OCR

功能介绍识别泰国车牌图片中的车牌信息，返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 泰国车牌示例图约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15到8192px之间。

帮助中心 > 文字识别 OCR > API参考 > API
智能分类识别 - 文字识别 OCR
智能分类识别 - 文字识别 OCR

智能分类识别功能介绍自动分类识别17+种票证，支持指定票证的结构化识别和印章检测，并以JSON格式返回识别的结构化结果。接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1，该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。

帮助中心 > 文字识别 OCR > API参考 > API
解读识别结果 - 文字识别 OCR
解读识别结果 - 文字识别 OCR

words为识别出来的文本内容，confidence表示该字段的置信度。 location表示文字块的区域位置信息，采用图像坐标系，第一个文字块左上角顶点为[140,45]。 extracted_data表示图片中包含的联系人信息，仅在设置了入参extract_type，且图片中有联系人信息时支持提取。

帮助中心 > 文字识别 OCR > 用户指南 > 获取识别结果
文字识别 OCR - 文字识别 OCR
文字识别 OCR - 文字识别 OCR

模糊等干扰；支持任意倾斜角度的校正；支持身份证信息的有效性校验，如校验身份证号规则、校验出生日期与身份证号所表示的出生日期是否一致、校验性别与身份证号所表示的性别信息是否一致、校验当前日期是否在有效期内，可以在一定程度上判断身份证的有效性。该接口的应用场景广泛，可应用于远程身份

 帮助中心 > 文字识别 OCR > 功能总览
数据保护技术 - 文字识别 OCR
数据保护技术 - 文字识别 OCR

OCR服务处理以下类型的数据： OCR输入数据，包括图像（PNG、JPG 、JPEG和 BMP等）和文档（PDF 和 TIFF等）。 OCR结果，包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性，保障客户在使用OCR服务时数据安全。表1 OCR的数据保护手段和特性

 帮助中心 > 文字识别 OCR > 产品介绍 > 安全
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

板，最后通过参照字段的位置来校正待识别图片。基本概念参照字段为模板图片和待识别图片中的公共文字部分，所有需要识别的图片中都要包含参照字段，且位置必须固定。套件提供了自动搜索参照字段和手动框选参照字段这两种模式。自动搜索参照字段：未手动框选任何参照字段的情况下，默认激活自动搜索参照字段模式。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
框选参照字段 - 文字识别 OCR
框选参照字段 - 文字识别 OCR

为了检查并校正待识别的图片，这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板，通过参照字段的位置来校正待识别图片。基本概念参照字段为模板图片和待识别图片中的公共文字部分，所有需要识别的图片中都要包含参照字段，且位置必须固定。套件提供了自动搜索参照字段和手动框选参照字段这两种模式。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 通用单模板工作流
错误码 - 文字识别 OCR
错误码 - 文字识别 OCR

environment. 访问的API不存在或尚未在环境中发布。请检查API的URL是否拼写正确，例如，URL中是否缺少project_id。检查URI中的区域信息是否和调用服务配置的终端节点是否对应。 HTTP请求方法（POST，GET等）是否正确。具体的URI信息请在各接口的API页面查看。

帮助中心 > 文字识别 OCR > API参考
如何选购合适的API - 文字识别 OCR

如何选购合适的API 文字识别服务（OCR）提供四种类型的API：通用类、证件类、票据类、智能分类。除此之外，您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。通用类通用表格识别：提取表格内的文字和所在行列位置信息。通用文字识别：提取图片内的文字及其对应位置信息。

帮助中心 > 文字识别 OCR > 常见问题 > 服务开通类

总条数： 238

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OCR服务可以识别文本格式文件吗 - 文字识别 OCR

不同区域是否有时延 - 文字识别 OCR

通用类 - 文字识别 OCR

通用文字识别 - 文字识别 OCR

框选识别区 - 文字识别 OCR

框选识别区 - 文字识别 OCR

区域与可用区 - 文字识别 OCR

财务报表识别 - 文字识别 OCR

如何选取参照字段？ - 文字识别 OCR

如何获取图片base64编码 - 文字识别 OCR

识别结果容易漏字或多识别出内容怎么办？ - 文字识别 OCR

泰国车牌识别 - 文字识别 OCR

智能分类识别 - 文字识别 OCR

解读识别结果 - 文字识别 OCR

文字识别 OCR - 文字识别 OCR

数据保护技术 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

框选参照字段 - 文字识别 OCR

错误码 - 文字识别 OCR

如何选购合适的API - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线