检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图解文字识别
本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数
”为“ocr.cn-north-4.myhuaweicloud.com或ocr.cn-north-4.myhuaweicloud.cn”,请求URL为“https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/pas
传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。
请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度 false:不校正图片的倾斜角度
银行卡的类别,如:储蓄卡,信用卡。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表3所示。 表3 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径 图片的URL路径,和图片文件二选一。
销货清单的备注。 当传入图片为发票销货清单时返回此字段。 belong_issue_date String 销货清单的填开日期。 当传入图片为发票销货清单时返回此字段。 sales_mark Boolean 是否是销货清单: true:输入图片是销货清单。 false:输入图片不是销货清单。
在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。
通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。 网络图片识别 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 智能分类识别 检测定位图片上指定要识别的票证(
1920], 2的倍数;高度范围[64, 1080], 2的倍数。 如果输入不是NV21格式,请把输入的源图片转换为NV21格式,详情请参见转换图片颜色格式。 dst 目的图片。 x 裁剪区域左上角x坐标,范围[0, 1920], 2的倍数。 y 裁剪区域左上角y坐标,范围[0, 1080]
传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
String 与image二选一 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度
和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 通用文字识别 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。 图像各边的像素大小在15px到8192px之间。
存储中的图片进行处理,并且可以快速获取到处理后的图片。 应用场景 图片处理支持用户在云端对图片进行简单的缩略、剪切、压缩等操作,不需下载占用空间巨大的本地图片处理软件即可直接在线对图片进行处理。 例如,可以随时随地在线对在云相册中的图片进行效果、缩略设置后,即刻在线将图片分享给好友、同事等。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
提取图片中的图片暗水印 功能介绍 对已嵌入图片暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以图片二进制流的格式返回从图片里提取的出的图片暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *
图片处理约束限制 操作限制 所有的图片处理操作均不会修改原图。 归档存储不支持图片处理。 深度归档存储不支持图片处理。 使用SSE-KMS服务端加密的OBS桶不能用做图片处理。 当前只有桶版本号为3.0的桶支持图片处理。桶版本号可以在对象存储服务控制台上,进入桶概览页后,在“基本信息”中查看。