检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。
None 服务介绍 文字识别 OCR 文字识别技术简介 01:46 文字识别技术简介 快速入门 文字识别 OCR 使用SDK 06:38 SDK使用指导 文字识别 OCR 使用API 03:04 API使用指导 问题排查 文字识别 OCR 获取Token时帐密报错 03:53 获取
使用OCR服务需要的权限 使用OCR服务时,如果您需要使用华为云对象存储服务(OBS)中的数据,请开通对象存储服务OBS授权,可在控制台进行开通。 OCR服务支持IAM细粒度划分策略。可以为子用户设置OCR服务的使用权限。 父主题: 权限类
自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。
用户直接调用OCR SDK提供的接口函数即可实现使用文字识别服务业务能力的目的。
OCR服务是否支持离线使用 不支持离线使用,调用SDK必须能够访问公网才可以的,因为OCR接口部署在华为云云端,所以需要您的网络可以访问公网才可以调用服务接口。 父主题: 产品咨询类
首次使用OCR 如果您是首次使用OCR的用户,建议您学习并了解如下信息: 功能介绍 通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别、证件类文字识别、票据类文字识别。
OCR服务的SDK需要付费购买吗 OCR服务SDK供用户免费下载,并依据API调用次数进行收费。 父主题: SDK使用类
创建应用 在使用自定义OCR开发应用之前,需要创建应用,填写应用基本信息、选择工作流。 前提条件 保证华为云账号不欠费。在使用自定义OCR产品时,需在“文字识别”控制台页面订阅自定义OCR服务。
OCR自定义策略 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参见权限管理。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。
自定义OCR 自定义OCR介绍 创建应用 通用单模板工作流 多模板分类工作流 字段类型 查看应用详情 常见问题
查看应用详情 创建应用后,您可以在“文字识别->自定义OCR”控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在“自定义OCR控制台”选择预置工作流创建应用,详情请见创建应用。 进入应用详情页 登录“文字识别”管理控制台,单击左侧菜单的“自定义OCR”。
目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。 API支持识别的图片版式依赖于创建自定义OCR工作流时的类型。 调用方法 请参见如何调用API。 前提条件 在使用之前,你需要通过OCR控制台,完成自定义OCR工作流的开发。
识别类型 是 可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 识别结果存储目录 是 指定识别结果存储的OBS目录。
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
文字识别SDK简介 文字识别SDK概述 文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。
OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据,您可将视频流进行提取帧图片操作,提取出图片后进行识别。 父主题: 产品咨询类
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。