图片文字识别转换

什么是图片文字识别转换?

图片文字识别转换是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。


为什么选择华为云文字识别OCR?

文字识别OCR提供在线文字识别服务,将图片、扫描件或PDF、OFD文档中的文字识别成可编辑的文本。OCR文字识别支持证件识别票据识别、定制模板识别、通用表格文字识别等。

识别精度高:采用先进的自研深度学习算法,结合亿万级海量标注数据样本训练,针对各种业务场景优化。

稳定服务:华为云OCR成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。

支持复杂场景:证件支持复杂背景、扭曲、倾斜等场景下的文字识别;表单支持盖章、错行等场景。

简单易用:提供符合RESTful规范的API访问接口,兼容性强,使用方便。


图片文字识别转换指南

  • 文字识别使用简介

    服务以开放API(Application Programming Interface,应用程序编程接口)的方式提供文字识别能力,用户调用API接口需要具备一定的编程开发基础,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。

    服务以开放API(Application Programming Interface,应用程序编程接口)的方式提供文字识别能力,用户调用API接口需要具备一定的编程开发基础,文字识别后返回的结果为JSON格式,用户需要通过编程来处理识别结果。

  • 文字识别功能体验与试用

    在开通文字识别 OCR 前,请先使用 OCR体验馆 体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。开通OCR后,默认按API调用次数进行收费。说明:使用OCR体验馆前,请先注册华为云帐号,并实名认证。

    在开通文字识别 OCR 前,请先使用 OCR体验馆 体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。开通OCR后,默认按API调用次数进行收费。

  • 文字识别使用流程

    使用文字识别服务前需注册华为云账号,并实名认证。第一步:开通文字识别OCR服务;第二步,准备数据;第三步,调用API或SDK;最后,获取识别结果。用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。

    使用文字识别服务前需注册华为云账号,并实名认证。第一步:开通文字识别OCR服务;第二步,准备数据;第三步,调用API或SDK;最后,获取识别结果。用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。

  • 文字识别 开通服务

    在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态将显示为“已开通”。如果您需要使用存储在对象存储服务(OBS)上的数据,请在开通服务页面进行服务授权。

    在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。服务开通成功后,开通状态将显示为“已开通”。如果您需要使用存储在对象存储服务(OBS)上的数据,请在开通服务页面进行服务授权。

  • 文字识别 准备数据

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片;支持图像任意角度的水平旋转;图像各边的像素大小在15px到8192px之间等。

    受技术与成本多种因素制约,文字识别服务存在一些约束限制。只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片;支持图像任意角度的水平旋转;图像各边的像素大小在15px到8192px之间等。

  • 文字识别 在线调试

    文字识别 API Explorer 在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。前提:已注册帐号,并实名认证,帐号不能处于异常状态。

    文字识别 API Explorer 在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。前提:已注册帐号,并实名认证,帐号不能处于异常状态。

  • 文字识别 本地调用

    该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

    该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

  • 文字识别 解读识别结果

    本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。调用成功后,在“JSON返回结果”中,可见result字段,包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置等信息。

    本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。调用成功后,在“JSON返回结果”中,可见result字段,包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置等信息。

  • 文字识别 识别结果后处理

    提取特定字段导入Excle需开通身份证识别,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包,登录访问秘钥页面,获取AK、SK。可以新增访问秘钥,或使用已有的访问秘钥。

    提取特定字段导入Excle需开通身份证识别,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包,登录访问秘钥页面,获取AK、SK。可以新增访问秘钥,或使用已有的访问秘钥。

文字识别视频指导

文字识别 OCR SDK使用指导

06:38

文字识别 OCR API使用指导

03:04

文字识别的常见问题

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

您是否有这些问题?