截图文字识别-提取图片的文字介绍

华为云文字识别 OCR

文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。


识别精度高:

采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化

稳定服务:

华为云OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

支持复杂场景:

证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景

简单易用:

提供符合RESTful规范的API访问接口,兼容性强,使用方便

截图文字识别-功能介绍

  • 截图文字识别-通用类

    通用类OCR(General OCR),支持表格识别、文档识别、网络图片识别、手写文字识别、智能分类识别、健康码识别、核酸检测记录识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

    通用类OCR(General OCR),支持表格识别、文档识别、网络图片识别、手写文字识别、智能分类识别、健康码识别、核酸检测记录识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

  • 截图文字识别-证件类

    证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、营业执照识别、银行卡识别、道路运输证识别、车牌识别、名片识别、VIN码识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。

    证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、营业执照识别、银行卡识别、道路运输证识别、车牌识别、名片识别、VIN码识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。

  • 截图文字识别-票据类

    票据类OCR(Receipt OCR),支持增值税发票识别、机动车销售发票识别、出租车发票识别、火车票识别、定额发票识别、车辆通行费发票识别、飞机行程单识别以及发票验真;支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

    票据类OCR(Receipt OCR),支持增值税发票识别、机动车销售发票识别、出租车发票识别、火车票识别、定额发票识别、车辆通行费发票识别、飞机行程单识别以及发票验真;支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

  • 截图文字识别-行业类

    行业类 OCR(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别、医疗化验单据识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

    行业类 OCR(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别、医疗化验单据识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

  • 截图文字识别-自定义模板

    自定义模板OCR(Custom OCR),支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。

    自定义模板OCR(Custom OCR),支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。

截图文字识别的常见问题

CDN动态加速的常见问题

  • 截图文字识别OCR 开通按钮置灰,如何处理?

    可能是因为当前使用的是IAM用户,IAM用户没有开通服务的权限。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。

    使用账号登录OCR控制台,开通服务。

  • 企业主账号购买的截图文字识别 OCR 套餐包资源,子账号如何使用?

    “企业主账号”与“子账号”为通俗意义的说法,准确上为“账号”与“IAM用户”。账号与IAM用户可以类比为父子关系,账号是资源归属以及计费的主体,对其拥有的资源具有所有权限。IAM用户由账号创建,只能拥有账号授予的资源使用权限,账号可以随时修改或者撤销IAM用户的使用权限。IAM用户进行资源操作时产生的费用统一计入账号中,IAM用户不需要为资源付费。使用账号可以创建IAM用户给IAM用户授权,登录IAM用户即可查看和使用账号授权的资源。

  • 截图文字识别 OCR 为什么成功获取Token还会返回401状态码?

    使用Token方式调用OCR服务返回401状态码,表示Token已经过期。Token的有效期为24小时,建议重新获取Token调用OCR服务。

  • 截图文字识别 OCR API是否可以混用?

    不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。

  • 截图文字识别 OCR的并发是多少

    文字识别服务属于公有云服务,线上用户资源共享,并发量会根据线上用户的调用情况动态调整。

    如遇到突发高峰导致的并发量不够用的情况,您可以尝试以下两种解决方法:

    通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求.

    后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。

    如果需要更大的并发需求,尤其是常态性的持续多并发需求,请通过华为云客服联系我们。详细描述您的使用场景和并发需求。

  • 截图文字识别OCR服务提供哪些版本的SDK?

    目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。

    如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《API参考》手册,该手册详细介绍了如何调用API及各个API接口的详细参数信息。

  • 使用截图文字识别OCR服务需要的权限

    使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。

    OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。

截图文字识别 OCR-使用指南

截图文字识别功能体验与试用

了解详情

截图文字识别使用流程简介

如何准备截图文字识别数据

在线调试API

如何开通文字识别服务

解读截图文字识别结果