怎么样提取图片文字_图片转换为文字

OCR服务能提取哪些类型图片文字？

通用表格识别：提取表格内的文字和所在行列位置信息，适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化，恢复结构化信息。

通用文字识别：提取图片内的文字及其对应位置信息，并能够根据文字在图片中的位置进行结构化整理工作。

手写文字识别：识别文档中的手写文字信息，并将识别的结构化结果返回给用户。

网络图片识别：自动识别网络图片内的所有文字及其对应位置信息，并能根据识别出来的结果进行联系人信息的提取，同时可供进一步的数据挖掘后处理操作。

智能分类识别：自动检测定位图片上指定要识别的票证，一次扫描即可识别票证的位置坐标、结构化识别的内容以及对应的类别。

身份证识别：自动识别身份证上的全部信息，支持身份证正反面识别，一次扫描即可识别身份证号码、姓名、地址等全部信息，在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。

驾驶证识别：自动识别驾驶证正页与副页上的全部信息，自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息，在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。

行驶证识别：自动识别行驶证正页与副页上的全部信息，自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息，在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别行驶证信息。

护照识别：针对中国护照，可识别护照上的全部信息；针对其他国家护照，可根据两行国际标准化的机读码识别出6-7个关键字段信息，包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。

营业执照识别：识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。在暗光，倾斜、水印等异常条件下均可正常识别执照信息。

银行卡识别：自动识别银行卡正面的信息，识别信息包括卡片类型（借记卡或信用卡）、银行卡卡号、有效日期、发卡行、持卡人姓名（限信用卡）。省去手动录入过程。

道路运输证识别：自动识别道路运输证的全部信息，一次扫描即可识别业户名称、道路运输证号、车辆号牌、车辆类型等全部信息。

车牌识别：自动识别图片中的车牌信息。

名片识别：自动识别名片中的信息，识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息，并将识别结果返回给用户。

增值税发票识别：通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段，快速将增值税发票上的文字信息识别出来，用于后续的进一步处理，节省大量的人工录入成本。

机动车销售发票识别：自动识别机动车销售发票图片内的文本内容，并返回结构化字段信息，用于后续的进一步处理，节省大量的人工录入成本。

飞机行程单识别：自动识别飞机行程单的全部信息，一次扫描即可识别旅客姓名、有效身份证件号码、订单号、票价等全部信息。

定额发票识别：自动识别定额发票的全部信息，一次扫描即可识别发票号码、发票代码、地址、发票金额等全部信息。

火车票识别：自动识别火车票的全部信息，一次扫描即可识别一张车票的ID、检票口信息、车次等全部信息。

出租车发票识别：自动识别出租车发票的全部信息，一次扫描即可识别归属地区、发票代码、发票号码、电话（包括电话、监督电话）等全部信息。

车辆通行费发票识别：自动识别车辆通行费发票的全部信息，一次扫描即可识别发票代码、发票号码、入口、出口、收费金额、收费员、车辆类型、日期、时间等主要信息。

提取图片文字、图片转换文字服务使用流程

收起

开通文字识别收起

① 在开通文字识别OCR前，可在线体验服务功能，该方式无需编程，只需在网页端上传图片，即可体验识别效果。
② 在开通文字识别OCR前，需要提前注册华为云账号，并进行实名认证。
③ OCR服务提供的开通方式有两种，分别为按需计费和套餐包计费，用户可以任选其一进行开通服务。

查看详情
收起

准备数据收起

① 首先要查看数据传入的要求，受技术与成本多种因素制约，文字识别服务存在一些约束限制。
② 然后选择数据传入的方式，使用OCR API或SDK时，数据主要通过以下两种方法传入，分别为image和url。

查看详情
收起

调用API或SDK 收起

①在线调试： API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时，集成开发环境CloudIDE，可完成代码的构建、调试、运行。
② 本地调用：该接口可以识别表格图片中的文字内容，并将识别结果以JSON格式返回给用户。返回结果包含两类：纯文本区（text）和表格区（table），并返回表格结构（row, column）和文本信息。

查看详情
收起

获取识别结果收起

① 解读识别结果：调用网络图片API成功后，在“JSON返回结果”中，可见result字段，该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。
② 识别结果后处理：调用身份证识别API，并从获取到的JSON结果中，提取所需的字段，填入至Excel。或将PDF文件转换为图片，并调用网络图片识别API，获取识别结果。

查看详情

图片转换为文字有哪些用途

通用类图片转换文字

支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别，自适应分析各种版面和表格，快速实现各种文档电子化

支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别，自适应分析各种版面和表格，快速实现各种文档电子化

了解详情
证件类图片转换文字

支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取

支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取

了解详情
票据类图片转换文字

支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真，支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真，支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。

了解详情

提取图片文字、图片转换文字常见问题解答

开通提取图片文字服务，如何选购合适的API？

文字识别服务（OCR）提供四种类型的API：通用类、证件类、票据类、智能分类。
1、通用类：
通用表格识别：提取表格内的文字和所在行列位置信息。
通用文字识别：提取图片内的文字及其对应位置信息。
手写文字识别：识别手写文字、印刷文字信息。
网络图片识别：识别网络图片内的所有文字及其对应位置信息。
2、证件类：
身份证识别、护照识别、银行卡识别
驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别
营业执照识别、名片识别
3、票据类：
增值税发票识别（增值税专用发票、增值税普通发票、增值税电子普通发票、通行费发票、卷票）
定额发票、火车票、出租车发票
机动车销售发票、车辆通行费发票
飞机行程单
4、智能分类：
一张待识别图片中包含了卡证、发票多个内容时，进行混合识别。
一张待识别图片中包含了多张同类型的发票。
一张待识别图片中包含了多张不同类型的发票。
购买图片转换文字服务套餐包后，为什么会出现额外的计费或欠费？

1、套餐包额度已使用完
套餐包额度用完后，默认会转为按需计费，当账户中余额不足时，无法对当前产生费用进行扣费，就会导致欠费。
2、套餐包额度未使用完
请登录费用中心检查套餐包的购买区域，与调用api的区域是否一致，套餐包不支持跨区调用。同时检查开通套餐包的API与实际调用的API是否一致。
文字识别OCR服务是否支持离线使用？

不支持离线使用，调用SDK必须能够访问公网才可以的，因为OCR接口部署在华为云云端，所以需要您的网络可以访问公网才可以调用服务接口。
图片转文字服务识别身份证正反面总计调用几次接口？

使用身份证识别时，如果要识别身份证的正面和反面，需要您调用两次身份证识别接口，具体请参见身份证识别章节。
OCR服务可以识别文本格式文件吗？

增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件，可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。
提取图片文字服务如何提高识别速度

识别速度与图片大小有关，图片大小会影响网络传输、图片base64解码等处理过程的时间，因此建议在图片文字清晰的情况下，适当压缩图片的大小，以便降低图片识别时间。推荐上传JPG图片格式。
根据实践经验，一般建议证件类的小图(文字少)在1M以下，A4纸大小的密集文档大图在2M以下。
提取图片文字服务如何提高识别精度

1、尽量使用文字清晰度高、无反光的图片。进行图片采集时，尽量提高待识别文字区域占比，减少无关背景占比，保持图片内文字清晰人眼可辨认。
2、若图片有旋转角度，算法支持自动修正，建议图片不要过度倾斜。
3、图片尺寸方面，建议最长边不超过8192像素，最短边不小于15像素，图像长宽比例维持常见水平 5:1 内（具体请以各个服务API文档为准）。
提取图片文字服务支持上传图片后直接导出结果吗？

目前OCR服务不支持上传图片后直接导出结果，需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。
图片质量类报错处理办法

问题现象：
调用文字识别API时，产生以下图片质量类报错。
错误码AIS.0102：图片格式不支持。
错误码AIS.0103：图片尺寸不满足要求。
错误码AIS.0104：非支持的图片类型或图片质量差。
解决方法：
请参考使用限制检查图片的格式、像素是否符合规范。
请检查图片的base64编码是否完整。
请检查图片质量，图片中文字是否清晰，肉眼可识别。
请检查API功能是否和输入的图片匹配。
OCR服务的SDK需要付费购买吗？

OCR服务SDK供用户免费下载，并依据API调用次数进行收费。

提取图片文字、图片转换文字实用文档下载

提取图片文字最新动态

立即下载
提取图片文字产品介绍

立即下载
提取图片文字快速入门

立即下载
提取图片文字用户指南

立即下载

提取图片文字 SDK参考

立即下载
提取图片文字 API参考

立即下载
提取图片文字最佳实践

立即下载
提取图片文字常见问题

立即下载

爆款云服务器和云产品限时领取免费体验，每位新用户仅限一次

立即试用

怎么样提取图片文字、图片转换文字

怎么样提取图片文字、图片转换文字

OCR服务能提取哪些类型图片文字？

提取图片文字、图片转换文字服务使用流程

图片转换为文字有哪些用途

提取图片文字、图片转换文字常见问题解答

提取图片文字、图片转换文字常见问题解答

提取图片文字、图片转换文字实用文档下载

提取图片文字最新动态

提取图片文字产品介绍

提取图片文字快速入门

提取图片文字用户指南

提取图片文字 SDK参考

提取图片文字 API参考

提取图片文字最佳实践

提取图片文字常见问题

7*24

备案

专业服务

退订

建议反馈

售前咨询热线

怎么样提取图片文字、图片转换文字

怎么样提取图片文字、图片转换文字

OCR服务能提取哪些类型图片文字？

提取图片文字、图片转换文字服务使用流程

图片转换为文字有哪些用途

提取图片文字、图片转换文字常见问题解答

提取图片文字、图片转换文字常见问题解答

提取图片文字、图片转换文字实用文档下载

提取图片文字 最新动态

提取图片文字 产品介绍

提取图片文字 快速入门

提取图片文字 用户指南

提取图片文字 SDK参考

提取图片文字 API参考

提取图片文字 最佳实践

提取图片文字 常见问题

7*24

备案

专业服务

退订

建议反馈

售前咨询热线

提取图片文字最新动态

提取图片文字产品介绍

提取图片文字快速入门

提取图片文字用户指南

提取图片文字最佳实践

提取图片文字常见问题