PDF文字识别OCR

PDF文字识别简介

文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。


OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。

PDF文字识别OCR常见问题

SSL证书申请_SSL域名证书常见问题

  • 每月1000次的免费调用次数下线

    华为云对文字识别OCR服务的价格进行下调,新价格于2022/03/01 00:00(北京时间)正式生效,生效后文字识别OCR服务的新购、续费均按调整后价格收取费用(调价前已生效的按需阶梯计费与已购买的预付费套餐包不受本次降价影响)。具体价格请在新价格生效后参考产品的计费详情页

  • 购买文字识别套餐包后,为什么会出现额外的计费或欠费

    套餐包额度已使用完

    文字识别套餐包额度用完后,默认会转为按需计费,当账户中余额不足时,无法对当前产生费用进行扣费,就会导致欠费。


    套餐包额度未使用完

    请登录费用中心检查套餐包的购买区域,与调用api的区域是否一致,套餐包不支持跨区调用。同时检查开通套餐包的API与实际调用的API是否一致。

  • 什么是文字识别的宽限期和保留期

    宽限期是指客户的包周期资源到期未续订或按需资源欠费时,华为云提供给客户进行续费与充值的时间,宽限期内客户可正常访问及使用云服务。

    保留期是指宽限期到期后客户的包周期资源仍未续订或按需资源仍未缴清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。云服务进入宽限期/保留期后,华为云将会通过邮件、短信等方式向您发送提醒,提醒您续订或充值。保留期到期仍未续订或充值,存储在云服务中的数据将被删除、云服务资源将被释放。

  • OCR文字识别中,哪些算有效计费

    1. OCR服务通过RestFul API调用,计费以Https请求返回的状态码为准,当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。

    2. OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。

    3. 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量提升同时识别准确率。

    4. 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。

  • 企业主账号购买文字识别的套餐包资源,子账号如何使用

    “企业主账号”与“子账号”为通俗意义的说法,准确上为“账号”与“IAM用户”。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。IAM用户由账号创建,只能拥有账号授予的资源使用权限,账号可以随时修改或者撤销IAM用户的使用权限。IAM用户进行资源操作时产生的费用统一计入账号中,IAM用户不需要为资源付费。使用账号可以创建IAM用户及给IAM用户授权,登录IAM用户即可查看和使用账号授权的资源。

  • 为什么文字识别中的实际调用次数与界面记录次数不一致

    OCR控制台只记录服务调用成功的次数,调用失败的次数不计算在使用量内。

    请参照如下操作查看调用失败的次数:

    1. 登录管理控制台。

    2. 在控制台首页选择“文字识别”,进入“文字识别”界面。

    3. 选择对应的服务(如:“智能分类识别”),单击“查看监控数据”,进入云监控控制台查看服务调用成功和失败的次数等具体信息。

  • OCR文字识别服务提供哪些版本的SDK

    目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。

    如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《API参考》手册,该手册详细介绍了如何调用API及各个API接口的详细参数信息。

  • OCR文字识别服务可以识别文本格式文件吗

    增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理

  • 使用OCR文字识别服务,是否会保存用户数据

    1. OCR服务坚持“华为云始终把可信作为产品质量的第一要素”的理念,我们基于安全、合规、隐私、韧性、透明,为您提供有技术、有未来、值得信赖的云服务。

    2. OCR服务承诺用户识别的图片与识别结果全部不作任何形式留存,识别返回后立即释放。

    3. 具体的声明请参考隐私政策声明法律声明,可信资源请参见白皮书资源。关于文字识别的相关声明请参见文字识别服务声明

PDF文字识别服务帮助文档

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;