检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。 能处理反光、暗光等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“通用单模
说明 使用方式 获取图片信息 获取图片的基本信息,包括:图片格式、大小、平均色值等。 接口调用 设置图片效果 支持对图片进行基础效果的设置,包括设置图片亮度、对比度,对图片进行整体锐化及模糊等处理。 控制台图形界面 控制台代码编辑 接口调用 图片缩略 支持对图片按照指定宽高和比例进行缩放。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分
机动车销售发票识别 功能介绍 识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3
飞机行程单识别 功能介绍 识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JP
页面上传图片,如图3所示。 上传图片至piccomp桶后OBS会自动生成事件触发工作流运行,将图片压缩。 触发器执行存在一定的延时,大概5分钟生效。 图3 上传文件 查看图片压缩效果 压缩后的图片存放在piccomp-output桶的output文件夹中。如图4所示,图片大小均有变小,实现了对图片的压缩。
银行卡的类别,如:储蓄卡,信用卡。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表3所示。 表3 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径 图片的URL路径,和图片文件二选一。
图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 不支持角度旋转的图片识别。 支持电子承兑汇票,对于拍照场景、复杂背景支持欠佳。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用
图解文字识别
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
在“添加”中,将图片模块拖拽到编辑页面空白处。 图1 添加图片模块 在“选择图片”对话框中,选择需要展示的图片。 图2 上传图片 在“我的图片”页签,您可以选择已上传的图片。在“互联网图片”页签中,您可以输入图片URL,URL必须为一张图片在某个网页上的地址,且必须是以图片格式后缀结尾。勾选
创建用于存储发票识别与验真结果的对象存储服务 OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流 FunctionGraph:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。 文字识别 OCR
提取图片中的图片暗水印 功能介绍 对已嵌入图片暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以图片二进制流的格式返回从图片里提取的出的图片暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
图片处理如何收费? 详细的服务资费费率标准请参见产品价格详情(单击链接跳转后选择价格详情页签)。 计费因子 原始图片大小 以GB为单位,根据使用月份数按固定单价收费。 图片处理根据原始图片的大小来进行计费,使用图片处理对多张图片进行处理时,数据大小自动累计。例如:将一张0.01GB的图片使用图片处理剪切和压缩后仅为0
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
车辆通行费发票识别 功能介绍 识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
图片嵌入暗水印 功能介绍 对图片嵌入文字暗水印或者图片暗水印,用户以formData的格式传入待加水印图片和水印相关信息,DSC服务对图片加完水印后返回给用户已嵌入水印的图片二进制流,目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *