检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。
对接OCR实现图片上文字识别功能 背景信息 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。
OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据,您可将视频流进行提取帧图片操作,提取出图片后进行识别。 父主题: 产品咨询类
处理图片持久化 图片处理持久化支持将处理后的图片同步存储至指定的OBS桶中,方便下次直接访问处理后的图片,减少图片处理花费的时间,提升用户体验。 图片处理持久化目前仅支持通过接口调用模式使用。在图片处理请求接口中,以参数名=参数值的格式,发送图片处理持久化请求,具体参数说明如表1所示。
获取图片信息 此功能仅支持通过接口调用模式使用。 通过此操作可以获取到图片的基本信息:长、宽、以及文件的大小和格式。如果图片包含Exif信息,将按照json格式返回完整的Exif信息。 操作名称:info 示例 查询example.jpg信息。 https://e-share.obs
上传图片 功能介绍 上传图片入库。 URI POST /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64 请求参数
是否支持发送彩信,图片或视频? 国内短信仅支持发送文字形式的短信。不支持发送视频、图片与文字选择结合的短信。 父主题: 产品规格
文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。 words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。
产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解 了解华为云文字识别服务的产品介绍、应用场景、使用限制,有助于更好的使用文字识别服务。 产品介绍 什么是文字识别 应用场景展示 使用限制说明 智能分类介绍 03 入门 文字识别服务以开放API(Application
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
获取图片内容 功能介绍 根据ID获取图片内容。 URI GET /v1/koosearch/image/{img_id} 表1 路径参数 参数 是否必选 参数类型 描述 img_id 是 String 图片ID,格式为img-[0-9a-z]{32} 最小长度:1 最大长度:64
处理图片 当图片上传后更新至hugb-bucket-input桶时,会生成事件,触发函数运行,将上传图片打水印,保存在hugb-bucket-output中。 上传图片生成事件 登录对象存储服务控制台,进入hugb-bucket-input桶对象界面,上传image.jpg图片,如图1所示。
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
2的倍数。 如果输入不是NV21格式,请把输入的源图片转换为NV21格式,详情请参见转换图片颜色格式。 dst 目的图片。 w 缩放宽度,范围[64, 1920], 2的倍数。 h 缩放高度,范围[64, 1080], 2的倍数。 type 目的图片的格式,0为NV21,1为NV12,默认为0。
获取图片平均色值 此功能仅支持通过接口调用模式使用。 通过此操作可以获取图片的平均色值,平均色值将以json格式返回一个十六进制值。 操作名称:average-hue 示例 获取图片example.jpg的平均色值,可在浏览器直接访问以下地址。 https://e-share.obs
文字识别SDK简介 文字识别SDK概述 文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。 文字识别以开放API(Application
通用表格识别API 通用文字识别 支持识别图片中的所有印刷体文字信息,可识别中英文和部分繁体字,并以json格式返回识别的文字和坐标位置。 该接口的应用场景广泛,可应用于拍照/截图识别、电子文档格式转化、纸质文档电子化、试题录入、论文素材收集等场景,方便用户进行文字信息的提取和录入,降低人工录入成本。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
println("\t" + response.getSignedUrl()); 访问公共可读的图片 针对公共可读的图片,直接在访问图片的URL请求后添加图片处理参数即可。 如下为获取名称为example.jpg的图片信息URL示例: https://e-share.obs.cn-north-1.myhuaweicloud
请求Body参数 参数 是否必选 参数类型 描述 id 是 String 图片ID elementName 否 String 图片名称,要更新的图片名称 最小长度:1 最大长度:255 elementUrl 否 String 图片url 最小长度:1 最大长度:255 isDisplay 否