检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
通用表格识别 功能介绍 识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
自动化部署步骤 登录华为云解决方案实施库,选择“一键部署”。 图1 一键部署发票识别与验真 在选择模板界面中,直接单击“下一步:配置参数”。 图2 选择模板 在配置参数界面中,自定义填写堆栈名称。根据表完成参数配置后,单击“下一步:高级配置”。 图3 配置参数 表1 参数说明 参数名称
服务开通后,您可以根据以下介绍选择合适的使用方式: 通过OCR体验馆在线调用OCR服务API。 如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学
片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解 了解华为云文字识别服务的产品介绍、应用场景、使用限制,有助于更好的使用文字识别服务。
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:/demo
通过使用文字识别服务的自研API,您可以使用文字识别服务的所有功能,如表1所示。 文字识别服务当前支持通用类、证件类、票据类和智能分类四种不同类型的接口。您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts Pro服务提供的文字识别套件,
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
估状态为端到端地对待识别图片自动分类并进行结构化识别。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。 上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信度”。
单击“上一步”,对当前模板进行修改。 如果识别结果正确,可单击“下一步”,部署模板。 上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。
字识别。 数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 名片示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 模板总览 检查所有模板是否已正确配置。 模板总览 评估 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 评估 父主题:
通用类 功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别
道路运输证识别 功能介绍 识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。
式。 构造请求:Postman环境的构造请求请参考构造请求章节,SDK环境的API调用详见SDK参考。 除上述两种方式外,还可通过APIE在线调试的方式调用API,步骤如下。 开通服务后进入APIE界面。 选择已开通的服务和开通服务对应的Region。 Body部分填入image
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比
调用API或SDK 在线调试 本地调用