检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
图片水印 图片嵌入暗水印 提取图片中的文字暗水印 提取图片中的图片暗水印 图片嵌入暗水印(文件地址版本) 提取图片中的文字暗水印(文件地址版本) 提取图片中的图片暗水印(文件地址版本) 父主题: API说明
开始使用 1、网络图片识别:支持图片格式等约束信息详网络图片识别文档 2、电子面单识别:支持图片格式等约束信息详电子面单识别文档 登录对象存储服务 OBS控制台,在桶列表选择快速部署 步骤三创建的用于上传快递图片的OBS桶,可直接上传图片或上传压缩包(支持zip及tar格式),如
为连接器的名称,“url”取值是图片的URL, “front”表示识别的是身份证正面。 单击脚本编辑器页面上方的,保存脚本。 保存成功后,单击,运行脚本。 不用设置输入参数,直接单击测试窗口右上角的。 在输出参数页签,检查是否识别出身份证上文字信息。 识别出身份证上的文字信息,表明成功调用连接器。
提取图片中的文字暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)的已嵌入文字暗水印的图片提取文字暗水印,支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm
增值税发票识别 功能介绍 识别增值税发票的类别,并以JSON格式返回识别的结构化结果,支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 发票验真API请参见发票验真。 图1 增值税发票示例图 图2 区块链发票示例图 图3
为连接器的名称,“url”取值是图片的URL, “front”表示识别的是身份证正面。 单击脚本编辑器页面上方的,保存脚本。 保存成功后,单击,运行脚本。 不用设置输入参数,直接单击测试窗口右上角的。 在输出参数页签,检查是否识别出身份证上文字信息。 识别出身份证上的文字信息,表明成功调用连接器。
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
源图,必须为NV21的格式。宽度范围[64, 1920], 2的倍数;高度范围[64, 1080], 2的倍数。 如果输入不是NV21格式,请把输入的源图片转换为NV21格式,详情请参见转换图片颜色格式。 dst 目的图片。 x 裁剪区域左上角x坐标,范围[0, 1920], 2的倍数。 y
与image二选一 图片的URL路径,目前支持: 公网HTTP/HTTPS URL 华为云OBS提供的URL,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权。详情参见配置OBS服务的访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。
通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别 营业执照识别、名片识别 票据类 增值税
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
提取图片中的图片暗水印 功能介绍 对已嵌入图片暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以图片二进制流的格式返回从图片里提取的出的图片暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *
通过AstroZero中的连接器上传并识别身份证图片 期望实现效果 AstroZero封装了不同类型的连接器用于对接其他服务,对接后即可在应用中使用该服务。例如,通过连接器对接OCR后,可识别某用户上传到华为OBS上的身份证图片的全部信息。 图1 在页面提交身份证信息 图2 成功识别图片 功能实现方法
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
财务报表识别 功能介绍 识别用户上传的表格图片中的文字内容,并将识别的结果返回给用户。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
如何获取OBS桶内最近图片的地址URL 将对象权限设置为匿名用户读取权限,通过分享对象URL,匿名用户通过分享的链接地址可访问对象数据。 前提条件 已经设置匿名用户对该对象的读取权限。 权限开启方法请参见对匿名用户授予指定对象的公共读权限。 不能对已加密的对象进行共享。 操作步骤
不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。
图解文字识别
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。