什么是文字识别OCR?

文字识别OCR服务介绍

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。

OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》

OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》

OCR平台有哪些能力?

1、通用类 OCR:通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

2、证件类 OCR:证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。

3、票据类 OCR:票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。

4、行业类 OCR:行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

5、定制模板 OCR:定制模板OCR(Custom OCR),支持用户自定义识别模板,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。

首次使用文字识别OCR工具

如果您是首次使用文字识别OCR的用户,建议您学习并了解如下信息:

1、功能介绍

通过功能介绍章节的内容,了解文字识别OCR不同类别的功能,包括通用类文字识别证件类文字识别票据类文字识别

2、入门使用

OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。

3、使用方式

如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》《SDK参考》获取详情。

4、由浅入深学习

您可以参考成长地图,由浅入深学习使用OCR。

华为云文字识别OCR有哪些功能?

文字识别OCR通用类功能介绍:

1、通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。

2、通用文字识别:提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。

3、手写文字识别:识别文档中的手写文字信息,并将识别的结构化结果返回给用户。

4、网络图片识别:自动识别网络图片内的所有文字及其对应位置信息,并能根据识别出来的结果进行联系人信息的提取,同时可供进一步的数据挖掘后处理操作。

5、智能分类识别:自动检测定位图片上指定要识别的票证,一次扫描即可识别票证的位置坐标、结构化识别的内容以及对应的类别。

文字识别OCR智能分类功能介绍:

智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。

文字识别OCR证件类功能介绍:

1、身份证识别:自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

2、驾驶证识别:自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。

3、行驶证识别:自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别行驶证信息。

4、护照识别:针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。

5、营业执照识别:识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。 在暗光,倾斜、水印等异常条件下均可正常识别执照信息。

6、银行卡识别:自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。省去手动录入过程。

文字识别OCR票据类功能介绍:

1、增值税发票识别:通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。

2、机动车销售发票识别:自动识别机动车销售发票图片内的文本内容,并返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。

3、飞机行程单识别:自动识别飞机行程单的全部信息,一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。

4、定额发票识别:自动识别定额发票的全部信息,一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。

5、火车票识别:自动识别火车票的全部信息,一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。

6、出租车发票识别:自动识别出租车发票的全部信息,一次扫描即可识别归属地区、发票代码、发票号码、电话(包括电话、监督电话)等全部信息。

文字识别OCR在线体验的计费项有哪些?

按API调用次数计费,计费价格请参见价格计算器

只有调用成功才会计算调用次数,其中返回的2xx状态码表示调用成功,调用失败不计费。

文字识别OCR的计费模式:

按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。

套餐包计费:

1、相比“按需计费”具有更大折扣。

2、套餐包有效期为1年,到期不会自动顺延,请在有效期内使用完。

3、套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。

4、套餐包费用为一次性支付,即刻生效,暂不支持指定日期生效。

5、套餐包可叠加使用,如果您购买了多个套餐包,则套餐包的扣减规则如下:

按照套餐包来源类型扣费,扣减优先级由高到低为:免费额度->套餐包计费->按需计费。

按套餐包创建、生效、失效时间扣费。

多个套餐包,创建时间相同时,优先抵扣先生效的。

多个套餐包,生效时间相同时,优先抵扣先失效的。

多个套餐包,失效时间相同时,优先抵扣先创建的。

文字识别OCR常见问题解答

文字识别OCR常见问题解答

更多识别OCR问题答疑请前往 了解更多

更多识别OCR问题答疑请前往 了解更多

  • 如何选择文字识别OCR套餐包的区域?

    不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点

    请先确定使用的服务与区域之后再购买相应区域的套餐包。

  • 如何关闭已申请的文字识别OCR服务?

    文字识别OCR服务开通后,如不使用,可在控制台进行关闭。

  • 文字识别OCR如何选购合适的API?

    文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。

    除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。

  • 文字识别OCR中,哪些算有效计费?

    文字识别OCR服务通过RestFul API调用,计费以Https请求返回的状态码为准,当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。

    文字识别OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。

    在客户使用文字识别OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量提升同时识别准确率。

    由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。

  • 文字识别OCR不同API的套餐包是否可以共享?

    API与套餐包是一一对应关系,只能抵扣对应接口的调用次数。

    例如,您购买了身份证识别API套餐包,只能在身份证识别接口上使用,不能与其他API共用。

  • 文字识别OCR购买套餐包后,为什么会出现额外的计费或欠费?

    1、套餐包额度已使用完

    套餐包额度用完后,默认会转为按需计费,当账户中余额不足时,无法对当前产生费用进行扣费,就会导致欠费。

    2、套餐包额度未使用完

    请登录费用中心检查套餐包的购买区域,与调用api的区域是否一致,套餐包不支持跨区调用。同时检查开通套餐包的API与实际调用的API是否一致。

  • 什么是文字识别OCR宽限期和保留期?

    宽限期是指客户的包周期资源到期未续订或按需资源欠费时,华为云提供给客户进行续费与充值的时间,宽限期内客户可正常访问及使用云服务。

    保留期是指宽限期到期后客户的包周期资源仍未续订或按需资源仍未缴清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。云服务进入宽限期/保留期后,华为云将会通过邮件、短信等方式向您发送提醒,提醒您续订或充值。保留期到期仍未续订或充值,存储在云服务中的数据将被删除、云服务资源将被释放。

  • 使用文字识别OCR服务,是否会保存用户数据?

    1、文字识别OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。

    2、文字识别OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。

    3、具体的声明请参考隐私政策声明法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明