检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取图片信息 此功能仅支持通过接口调用模式使用。 通过此操作可以获取到图片的基本信息:长、宽、以及文件的大小和格式。如果图片包含Exif信息,将按照json格式返回完整的Exif信息。 操作名称:info 示例 查询example.jpg信息。 https://e-share.obs
机动车销售发票识别 功能介绍 识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
去除图片元信息 此功能支持在控制台代码编辑模式和接口调用模式使用。 通过此操作可以去除图片元信息。 操作名称:strip 示例 去除图片元信息。 https://e-share.obs.cn-north-1.myhuaweicloud.com/example.jpg?x-imag
2的倍数。 如果输入不是NV21格式,请把输入的源图片转换为NV21格式,详情请参见转换图片颜色格式。 dst 目的图片。 w 缩放宽度,范围[64, 1920], 2的倍数。 h 缩放高度,范围[64, 1080], 2的倍数。 type 目的图片的格式,0为NV21,1为NV12,默认为0。
获取图片平均色值 此功能仅支持通过接口调用模式使用。 通过此操作可以获取图片的平均色值,平均色值将以json格式返回一个十六进制值。 操作名称:average-hue 示例 获取图片example.jpg的平均色值,可在浏览器直接访问以下地址。 https://e-share.obs
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
使用身份证图片、人脸图片验证 功能介绍 使用身份证正反面图片提取姓名和身份证号码,与人脸图片进行三要素身份审核。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。
println("\t" + response.getSignedUrl()); 访问公共可读的图片 针对公共可读的图片,直接在访问图片的URL请求后添加图片处理参数即可。 如下为获取名称为example.jpg的图片信息URL示例: https://e-share.obs.cn-north-1.myhuaweicloud
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
请求Body参数 参数 是否必选 参数类型 描述 id 是 String 图片ID elementName 否 String 图片名称,要更新的图片名称 最小长度:1 最大长度:255 elementUrl 否 String 图片url 最小长度:1 最大长度:255 isDisplay 否
图片删除 功能介绍 图片删除 URI POST /v1/{project_id}/trace/trace-sweepcode/product-image/delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串
返回数据 表5 data 参数 参数类型 描述 id String 图片ID elementName String 图片名称 elementUrl String 图片url imageType String 图片类型 isDisplay String 是否展示:0展示,1不展示 merchant
of record objects 图片详情 表7 record 参数 参数类型 描述 id String 图片ID elementName String 图片名称 elementUrl String 图片url imageType String 图片类型 isDisplay String
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。
这样的数据和算法生成的模型仅适用于教学模式,并不能应对复杂的预测场景。即生成的模型对预测图片有一定范围和要求,预测图片必须和训练集中的图片相似(黑底白字)才可能预测准确。 图8 示例图片 图9 预测结果展示 Step7 清除资源 如果不再需要使用此模型及在线服务,建议清除相关资源,避免产生不必要的费用。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分