通用表格识别-识别表格图片中的文字内容

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


通用表格识别:识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。


文字识别优势

识别精度高:

华为云文字识别采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化。

稳定服务:

华为云文字识别OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。

支持复杂场景:

证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景。

简单易用:

华为云文字识别提供符合RESTful规范的API访问接口,兼容性强,使用方便。

通用表格文字识别使用和计费

通用表格文字识别提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

通用表格文字识别使用和计费

  • 通用表格识别功能介绍:

    ●识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。

    ●对于相同板式的图片,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API。

  • 通用表格识别的调试:

    ●您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。。

  • 通用表格识别使用的前提条件:

    ●在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。

  • 通用表格识别计费项:

    ●按API调用次数计费,计费价格请参见价格计算器。

    ●只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。

  • 通用表格文字识别计费模式:

    ●华为云文字识别提供两种计费模式:按需计费,套餐包计费。

    ●华为云按需计费为默认计费方式,指按照API调用次数收费,按次进行结算。

  • 通用表格文字识别套餐包计费

    ●相比“按需计费”具有更大折扣。

    ●套餐包有效期为1年,到期不会自动顺延,请在有效期内使用完。

    ●套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。

    ●套餐包费用为一次性支付,即刻生效,暂不支持指定日期生效。

展开内容
收起内容

文字识别常见问题

表格文字识别必看文档

  • 什么是文字识别

    OCR以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。

    OCR以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。

  • 通用类文字识别功能介绍

    通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

    通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

  • 文字识别的使用约束

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。

  • 文字识别的价格和购买方式

    OCR提供两种计费方式下不同区域、不同应用场景的文字识别服务,含功能场景包括不仅限于以下类别:通用文字识别、机动车销售发票识别、发票验真等数十种文字识别服务

    OCR提供两种计费方式下不同区域、不同应用场景的文字识别服务,含功能场景包括不仅限于以下类别:通用文字识别、机动车销售发票识别、发票验真等数十种文字识别服务

  • 什么是文字识别的并发量

    OCR以公有云服务为主,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法:

    OCR以公有云服务为主,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法:

  • 文字识别剩余量及预警

    进入控制台费用中心“资源包”页面,即可直接查看套餐包的剩余使用量。相同规格资源包会汇总展示,仅支持查询当前有效的资源包和失效时间不超过18个月的资源包。

    进入控制台费用中心“资源包”页面,即可直接查看套餐包的剩余使用量。相同规格资源包会汇总展示,仅支持查询当前有效的资源包和失效时间不超过18个月的资源包。

  • OCR服务使用简介

    服务以开放API的方式提供文字识别能力,用户调用API接口需要具备一定的编程开发基础,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。

    服务以开放API的方式提供文字识别能力,用户调用API接口需要具备一定的编程开发基础,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。

  • 开通文字识别服务

    进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态将显示为“已开通”。

    进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态将显示为“已开通”。

  • 文字识别在线调试

    API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。本章节介绍如何使用API Explorer调试API。

    API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。本章节介绍如何使用API Explorer调试API。

文字识别操作指导教程

文字识别OCR使用SDK

06:38

文字识别OCR使用SDK

文字识别 OCR使用API

03:04

文字识别 OCR使用API