检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流
附录 名词解释 基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 对象存储服务
ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。 本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别
与image二选一。 图片大小不超过10MB,图片的URL路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
服务开通后,您可以根据以下介绍选择合适的使用方式: 通过OCR体验馆在线调用OCR服务API。 如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学
存储中的图片进行处理,并且可以快速获取到处理后的图片。 应用场景 图片处理支持用户在云端对图片进行简单的缩略、剪切、压缩等操作,不需下载占用空间巨大的本地图片处理软件即可直接在线对图片进行处理。 例如,可以随时随地在线对在云相册中的图片进行效果、缩略设置后,即刻在线将图片分享给好友、同事等。
0接口统一切换成v2接口,例如通用文字识别URI由/v1.0/ocr/general-text更新成/v2/{project_id}/ocr/general-text。 原有的v1.0接口任然可以正常使用。 商用 - 2 飞机行程单识别功能优化 飞机行程单识别服务精度优化,支持不同场景下图片的识别。 商用
该参数与image二选一。图片大小不超过10MB,图片的url路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
图片水印 图片嵌入暗水印 提取图片中的文字暗水印 提取图片中的图片暗水印 图片嵌入暗水印(文件地址版本) 提取图片中的文字暗水印(文件地址版本) 提取图片中的图片暗水印(文件地址版本) 父主题: API说明
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。
FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息的截图上传至OB
图片处理约束限制 操作限制 所有的图片处理操作均不会修改原图。 归档存储不支持图片处理。 深度归档存储不支持图片处理。 使用SSE-KMS服务端加密的OBS桶不能用做图片处理。 当前只有桶版本号为3.0的桶支持图片处理。桶版本号可以在对象存储服务控制台上,进入桶概览页后,在“基本信息”中查看。
发票识别与验真 方案概述 资源和成本规划 实施步骤
在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进
授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 响应参数
import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; import com.huaweicloud.sdk.ocr.v1.*; import com.huaweicloud.sdk.ocr.v1.model.*; public class
图片处理如何收费? 详细的服务资费费率标准请参见产品价格详情(单击链接跳转后选择价格详情页签)。 计费因子 原始图片大小 以GB为单位,根据使用月份数按固定单价收费。 图片处理根据原始图片的大小来进行计费,使用图片处理对多张图片进行处理时,数据大小自动累计。例如:将一张0.01GB的图片使用图片处理剪切和压缩后仅为0
上传图片 功能介绍 上传图片入库。 URI POST /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64 请求参数