检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。
请求示例 “endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点。
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。
OCR是否支持事业单位和社会团体营业执照识别 OCR服务无事业单位和社会团体营业执照识别单独的API,建议使用智能文档解析API调试。 父主题: 产品咨询类
推荐您根据自己的业务情况使用智能文档解析产品,详细介绍可查看智能文档解析。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。
行业类 电子面单 识别各类快递公司的电子面单主要信息,包含三段码、收寄件人姓名电话地址及条形码运单号,快速提取信息,提高信息录入效率。
泰文身份证识别 自动识别身份证上的全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。 泰国车牌识别 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。
推荐您根据自己的业务情况使用智能文档解析产品,详细介绍可查看智能文档解析。 常见问题 智能文档解析与自定义模板的区别? 智能文档解析无需客户自己制作模板。 智能文档解析提供三个主要功能,分别是键值对提取、表格还原和版面分析。
表1 接口说明 类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。
上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。
OBS地址不合法。 请检查OBS地址。 ModelArts.4704 Obtaining the file from the OBS failed. 获取OBS文件失败。 请检查OBS文件。
上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。 单击“开始识别”,右侧会显示识别结果。
功能介绍 通用类 智能分类 证件类 票据类 行业类 智能文档解析
SDK常见报错请参考代码运行报错、json解析报错。
""" # 获取指定页面的pdf格式,注意:页面参数是事先解析出来的,不然会存在问题。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN
表2 接口与API对应关系表 接口 API 智能文档解析 POST /v2/{project_id}/ocr/smart-document-recognizer 通用表格识别 POST /v2/{project_id}/ocr/general-table 通用文字识别 POST /
您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。