检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
代码示例自动生成 API Explorer提供API检索及平台调试,支持全量快速检索、可视化调试、帮助文档查看、在线咨询。 您只需要在API Explorer中修改接口参数,即可自动生成对应的代码示例。同时,可在集成开发环境CloudIDE中完成代码的构建、调试、运行等操作。
智能文档解析 功能介绍 对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。
Go SDK 开发指南 NET NET SDK 开发指南 SDK代码示例自动生成 API Explorer提供API检索及平台调试,支持全量快速检索、可视化调试、帮助文档查看、在线咨询。
支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。
Java Python Go 更多 传入手写文字图片的base64编码进行内容识别,识别范围包括数字、字母、中文,识别过程关闭快速模式并不校验图片倾斜角度。
OCR能力 通用类 OCR 通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。
该接口的应用场景广泛,可应用于拍照/截图识别、电子文档格式转化、纸质文档电子化、试题录入、论文素材收集等场景,方便用户进行文字信息的提取和录入,降低人工录入成本。
OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。
常用操作 获取SDK代码示例 HOT 快速入门 Java SDK Python SDK Node.js SDK PHP SDK C++ SDK .NET SDK Go SDK 常见问题 了解更多常见问题、案例和解决方案 热门案例 如何使用OCR服务?
4.服务开通后,您可以按照官方文档数据要求,调用API或SDK步骤继续完成实际服务需求。
url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg
代码示例自动生成 API Explorer提供API检索及平台调试,支持全量快速检索、可视化调试、帮助文档查看、在线咨询。 您只需要在API Explorer中修改接口参数,即可自动生成对应的代码示例。同时,可在集成开发环境CloudIDE中完成代码的构建、调试、运行等操作。
遇到“APIG”开头的错误码,请参考本文档进行处理。 模块 错误码 错误信息 说明 建议解决方法 文字识别 AIS.0101 The input parameter is invalid. 输入参数不符合规范。 请检查输入参数是否正确。
url中不能存在中文字符,若存在,中文需要进行utf8编码。 side 否 String 检测行驶证的主页或副页。 front: 行驶证主页 back: 行驶证副页 double_side:行驶证双页信息 如果参数值为空或无该参数,系统默认识别主页,建议填写,准确率更高。
智能文档解析 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档,PDF只支持单页识别,可通过pdf_page_number参数指定页码。
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。
url中不能存在中文字符,若存在,中文需要进行utf8编码。 return_text_location 否 Boolean 返回文本块坐标及单元格坐标信息,可选值包括: true:返回文本块和单元格坐标; false:不返回。 未传入该参数时默认为false,即不返回。
修订记录 发布日期 修订说明 2021-08-30 SDK迭代更新,提供Java、Python、Node.js、PHP、C++、Go、.NET版本,历史SDK下线,停止维护。