检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 该接口支持字体分类功能,支持竖行文本识别。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制
page2pix(self, doc, page, trans): """ 根据给定的参数,解析当前页作为图片数据 """ # 获取指定页面的pdf格式,注意:页面参数是事先解析出来的,不然会存在问题。 return doc[page].getPixmap(matrix=trans
支持图像中身份证任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。 能处理反光、暗光等干扰的图片但影响识别精度。 目前支持识别单张身份证的正面或者反面。 支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。 调用方法 请参见如何调用API。
None 服务介绍 文字识别 OCR 文字识别技术简介 01:46 文字识别技术简介 快速入门 文字识别 OCR 使用SDK 06:38 SDK使用指导 文字识别 OCR 使用API 03:04 API使用指导 问题排查 文字识别 OCR 获取Token时帐密报错 03:53 获取Token时帐密报错
人脸识别上传的人脸图片还可以查询到图片数据吗 人脸识别不存储客户人脸图片,只是根据客户的图片来检测人脸参数,只存储人脸特征。如果需要存储图片数据可参考以下方法: 可以开通华为云OBS,存储人脸图片。 人脸图片可以存储在客户自己的数据库中。 父主题: API使用类
通用表格识别 功能介绍 识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详
小。用户通过该服务,可以同时识别出图片中包含的不同倾角正脸及侧脸。 图1 人脸检测示意图 人脸比对 通过对人脸区域的特征进行对比,该服务可以返回给用户两张图片中人脸的相似度。如果两张图片中包含多张人脸,则在两张图片中选取最大的人脸进行相似度比对。 图2 人脸比对示意图 人脸搜索
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
车牌识别 功能介绍 识别输入图片中的车牌信息,并以JSON格式返回其坐标和内容。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。 目前支持车牌类型含小型汽车
需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不
提取图片中的文字暗水印 功能介绍 对已嵌入文字暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以JSON的格式返回从图片里提取的出的文字暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
如何获取图片的base64编码 本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:\demo.jpg"
如何在含有多张人脸的图片中实现多人脸识别 当前人脸识别服务中,如果传入的图片中包含多个人脸,则只能选取最大的一个人脸进行识别。但是可以使用如下方法,实现一张图片中多张人脸的识别(比对/搜索): 调用人脸检测接口,可以得到多张人脸在图片中的像素位置。 通过获取到的人脸位置信息,从原
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
图片质量类报错处理办法 问题现象 调用文字识别API时,产生以下图片质量类报错。 错误码AIS.0102:图片格式不支持。 错误码AIS.0103:图片尺寸不满足要求。 错误码AIS.0104:非支持的图片类型或图片质量差。 解决方法 请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。
与image二选一 图片的URL路径,目前支持: 公网HTTP/HTTPS URL 华为云OBS提供的URL,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权。详情参见配置OBS服务的访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
全部 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别 定额发票识别