检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与image二选一 图片大小不超过10MB,图片的URL路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。
该参数与image二选一。图片大小不超过10MB,图片的url路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
提取图片中的图片暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)的已嵌入图片暗水印的图片提取图片暗水印,提取出的水印图片将存放在用户指定的位置(目前支持OBS),支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib
格线扭曲图像的文字识别。 支持中英文以及部分繁体字。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 通用文字识别 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD、PDF格式的图片。 图像各边的像素大小在15px到8192px之间。
与image二选一。 图片大小不超过10MB,图片的URL路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
ocr:generalText:subscribe 开通通用文字识别服务 √ × ocr:generalText:unsubscribe 取消开通通用文字识别服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers
银行卡的类别,如:储蓄卡,信用卡。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表3所示。 表3 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径 图片的URL路径,和图片文件二选一。
supported. 图片格式不支持,或image参数值不是base64编码字符串。 请检查图片格式,各服务支持图片格式请参考使用限制。 AIS.0103 The image size does not meet the requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。
1920], 2的倍数;高度范围[64, 1080], 2的倍数。 如果输入不是NV21格式,请把输入的源图片转换为NV21格式,详情请参见转换图片颜色格式。 dst 目的图片。 x 裁剪区域左上角x坐标,范围[0, 1920], 2的倍数。 y 裁剪区域左上角y坐标,范围[0, 1080]
发票识别与验真 方案概述 资源和成本规划 实施步骤
图片文件进行图片剪切、图片缩放、图片水印、格式转换等处理。 更多关于图片处理的内容,参见图片处理特性指南。 以下代码展示了如何使用下载对象接口实现图片处理: // 引入依赖库 require 'vendor/autoload.php'; // 使用源码安装时引入SDK代码库 //
在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。
现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流
该参数与image二选一。图片大小不超过10MB,图片的url路径目前支持: 公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
附录 名词解释 基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 对象存储服务
图片水印 图片嵌入暗水印 提取图片中的文字暗水印 提取图片中的图片暗水印 图片嵌入暗水印(文件地址版本) 提取图片中的文字暗水印(文件地址版本) 提取图片中的图片暗水印(文件地址版本) 父主题: API说明
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
0接口统一切换成v2接口,例如通用文字识别URI由/v1.0/ocr/general-text更新成/v2/{project_id}/ocr/general-text。 原有的v1.0接口任然可以正常使用。 商用 - 2 飞机行程单识别功能优化 飞机行程单识别服务精度优化,支持不同场景下图片的识别。 商用