检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认
智能分类 功能介绍 智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别
objects 键值对识别结果列表。 表9 SmartDocumentRecognizerKVBlock 参数 参数类型 描述 key String key-value对(键值对)中的key,例如“姓名:小明”中的“姓名” value String key-value对(键值对)中的value,例如“姓名:小明”中的“小明”
智能文档解析 功能介绍 智能文档解析基于领先的深度学习技术,对含有结构化信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。
如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学者,有代码编写基础,对HTTP请求与API调用有一定的了解,想快速体验OCR
CR服务,不同的区域之间资源包不互通,请根据您的实际需求慎重选择。 表1 接口说明 类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。
估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信度”。
如果不正确,可单击“创建新模板”,重新创建一个模板,或者单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。 上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL
打造智能化业务系统,提升业务效率。 产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解 了解华为云文字识别服务的产品介绍、应用场景、使用限制,有助于更好的使用文字识别服务。 产品介绍 什么是文字识别 应用场景展示 使用限制说明 智能分类介绍
OCR是否支持事业单位和社会团体营业执照识别 OCR服务无事业单位和社会团体营业执照识别单独的API,建议使用智能文档解析API调试。 父主题: 产品咨询类
参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆驾驶证纸质版本及交管12123提供的电子驾驶证版本识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
自定义模板套餐包1万次 自定义模板套餐包1千次 常见问题 智能文档解析与自定义模板的区别? 智能文档解析无需客户自己制作模板。 智能文档解析提供三个主要功能,分别是键值对提取、表格还原和版面分析。其中键值对提取是指提取和识别文档中存在关联的键值对信息,比如在合同文档中提取甲方-XX有限公司、
配置OBS访问权限 EI企业智能服务对于图片、语音等多媒体文件支持直接使用OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。 考虑到数据的安全,当对服务进行授权后,才可以使用授权方式的URL(https://<bucket-name>.<end
结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到4096px之间。
不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。
该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到4096px之间。
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:/demo
登录OCR控制台,为某个IAM用户开通智能分类识别,但是发现“开通状态”仍然显示未开通。 图1 为IAM用户开通智能分类识别 图2 开通状态 原因分析 上述操作是主账号或被授予所有权限(OCR FullAccess)的IAM子账号(用户1)为某个IAM(用户2)用户单独开通智能分类识别,并不是为当