搜索_华为云

使用流程简介 - 文字识别 OCR
使用流程简介 - 文字识别 OCR

使用流程简介文字识别是指对图像中的打印字符进行检测识别，通过调用API，识别图片中的文字，并返回JSON格式的识别结果。使用流程图1 使用流程使用前必读用户需要具备编程能力，熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户

 帮助中心 > 文字识别 OCR > 用户指南
如何选购合适的API - 文字识别 OCR

如何选购合适的API 文字识别服务（OCR）提供四种类型的API：通用类、证件类、票据类、智能分类。除此之外，您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。通用类通用表格识别：提取表格内的文字和所在行列位置信息。通用文字识别：提取图片内的文字及其对应位置信息。

帮助中心 > 文字识别 OCR > 常见问题 > 服务开通类
成本管理 - 文字识别 OCR
成本管理 - 文字识别 OCR

建议，寻找节约成本的机会。您还可以根据成本分析阶段的分析结果识别成本偏高的资源，通过云监控服务监控资源的使用情况，确定成本偏高的原因，然后采取针对性的优化措施。计费模式优化不同类型的业务对资源使用周期有不同的要求，为每一类业务确定合适的计费模式，灵活组合以达到最优效果。针对

 帮助中心 > 文字识别 OCR > 计费说明
删除应用 - 文字识别 OCR
删除应用 - 文字识别 OCR

删除应用如果已创建的模板应用不再使用，您可以删除模板释放资源。操作步骤登录“文字识别>自定义OCR”控制台。默认进入“应用开发>工作台”页面。在“我的应用”页签下，选择应用并单击“操作”列的“查看”。进入“应用资产”页面。图1 进入应用资产在“分类器列表”页签，选择多模板名称，单击操作列的“删除”。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
什么是文字识别 - 文字识别 OCR

Recognition，简称OCR）是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式，以JSON格式返回识别结果。 OCR以开放API（Application Programming Interface，应用程序编程接口）的方式提供给用户，用户使用Python、Java等编

 帮助中心 > 文字识别 OCR > 产品介绍
上传模板图片 - 文字识别 OCR
上传模板图片 - 文字识别 OCR

型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。前提条件已在自定义OCR控制台选择“多模板分类工作流”创建应用，详情请见创建应用。提前准备模板图片以及训练分类器的数据集，其要求请见数据要求。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
评估 - 文字识别 OCR
评估 - 文字识别 OCR

模板总览过后，需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片，在线评估模板分类情况和模板的文字识别情况，保证能在多个模板情况下正确分类测试图片的模板，并且能正确识别测试图片中的识别区文字。前提条件已在自定义OCR控制台选择“多模板分类工作流”创建应用，并已框选识别，详情请见模板总览。

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 多模板分类工作流
识别字符出现错误如何优化？ - 文字识别 OCR

识别字符出现错误如何优化？不同的错误情形需要具体分析：情形1：大部分文字识别正确，部分形近符号的识别错误。解决办法：产品提供了预置字段类型可以对结果进行处理，同时也提供了自定义（正则）类型、字典类型，用于纠正识别结果中的错误，适用范围详见字段类型。此外，您也可以在调用程序中

 帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR > 常见问题
准备数据 - 文字识别 OCR
准备数据 - 文字识别 OCR

以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。支持图像任意角度的水平旋转。目前不支持

 帮助中心 > 文字识别 OCR > 用户指南
银行回单识别 - 文字识别 OCR
银行回单识别 - 文字识别 OCR

创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。

帮助中心 > 文字识别 OCR > API参考 > API
户口本识别 - 文字识别 OCR
户口本识别 - 文字识别 OCR

携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。表3 请求Body参数

 帮助中心 > 文字识别 OCR > API参考 > API
智能分类 - 文字识别 OCR
智能分类 - 文字识别 OCR

直接统一调用一个API即可完成对各种卡、证、票的识别，无需在调用时判断图像类型，也不用再对每种数据分别调用不同的API，降低了集成使用的复杂度。价格更优惠价格详情请参考OCR服务价格计算器。降低管理难度无需对每个API的调用量进行单独的预测，然后分别购买不同大小的套餐包。以发票报销为例，很难

 帮助中心 > 文字识别 OCR > 产品介绍 > 功能介绍
权限管理 - 文字识别 OCR
权限管理 - 文字识别 OCR

如果您需要对华为云上购买的OCR资源，为企业中的员工设置不同的访问权限，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全的控制华为云资源的访问。

帮助中心 > 文字识别 OCR > 用户指南 > 权限管理
智能文档解析 - 文字识别 OCR
智能文档解析 - 文字识别 OCR

携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。表3 请求Body参数

 帮助中心 > 文字识别 OCR > API参考 > API
承兑汇票识别 - 文字识别 OCR
承兑汇票识别 - 文字识别 OCR

创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。

帮助中心 > 文字识别 OCR > API参考 > API
车辆合格证识别 - 文字识别 OCR

创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用OCR服务，账单的企业项目会被分类到企业ID对应的企业项目中。携带格式正确但不存在的ID，正常使用OCR服务，账单的企业项目会显示对应不存在的企业项目ID。不携带ID或格式错误ID（包含特殊字符等），正常使用OCR服务，账单的企业项目会被分类到"default"中。

帮助中心 > 文字识别 OCR > API参考 > API
自定义OCR介绍 - 文字识别 OCR
自定义OCR介绍 - 文字识别 OCR

图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。通用单模板工作流通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。多模板分类工作流支持用户自定义多个文字识别模板，通过AI分类算法，自动识别图片所需使用的模板，

帮助中心 > 文字识别 OCR > 用户指南 > 自定义OCR
错误码 - 文字识别 OCR
错误码 - 文字识别 OCR

environment. 访问的API不存在或尚未在环境中发布。请检查API的URL是否拼写正确，例如，URL中是否缺少project_id。检查URI中的区域信息是否和调用服务配置的终端节点是否对应。 HTTP请求方法（POST，GET等）是否正确。具体的URI信息请在各接口的API页面查看。

帮助中心 > 文字识别 OCR > API参考
V1版本APIs切换至V2版指导 - 文字识别 OCR

APIs切换步骤 V1版本APIs清单请参见表1。仅支持V2版本的API不在此表中列举。在进行版本替换时，请在您的业务代码中搜索“v1.0”相关的API。例如，搜索“v1.0/ocr”找到代码中API请求地址所在的代码行。将“v1.0/ocr”替换为“/v2/{project_

帮助中心 > 文字识别 OCR > 用户指南
最新动态 - 文字识别 OCR
最新动态 - 文字识别 OCR

飞机行程单识别：识别飞机行程单中的文字信息，并返回识别的结构化结果。定额发票识别：识别定额发票中的文字信息，并返回识别的结构化结果。商用 - 2 新增火车票识别、银行卡识别、营业执照识别火车票识别：识别火车票中的文字信息，并返回识别的结构化结果。银行卡识别：识别银行卡上的关键文字信息，并返回识别的结构化结果。

帮助中心 > 文字识别 OCR > 最新动态

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用流程简介 - 文字识别 OCR

如何选购合适的API - 文字识别 OCR

成本管理 - 文字识别 OCR

删除应用 - 文字识别 OCR

什么是文字识别 - 文字识别 OCR

上传模板图片 - 文字识别 OCR

评估 - 文字识别 OCR

识别字符出现错误如何优化？ - 文字识别 OCR

准备数据 - 文字识别 OCR

银行回单识别 - 文字识别 OCR

户口本识别 - 文字识别 OCR

智能分类 - 文字识别 OCR

权限管理 - 文字识别 OCR

智能文档解析 - 文字识别 OCR

承兑汇票识别 - 文字识别 OCR

车辆合格证识别 - 文字识别 OCR

自定义OCR介绍 - 文字识别 OCR

错误码 - 文字识别 OCR

V1版本APIs切换至V2版指导 - 文字识别 OCR

最新动态 - 文字识别 OCR

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线