检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不
接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 quick_mode 否 Boolean 快速模式开关,针对单行文字图片(要求
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。 “上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。 “删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。
文字识别SDK简介 文字识别SDK概述 文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、通用表格、通用文字等场景文字识别。 文字识别以开放API(Application
请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度 false:不校正图片的倾斜角度
已授权ModelArts服务和对象存储服务(OBS)。 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用O
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。 文字识别服务等级协议请参见华为云服务等级协议。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
护照识别 功能介绍 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取7个关键字段信息。该接口的使用限制请参见约束与限
提取图片中的图片暗水印 功能介绍 对已嵌入图片暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以图片二进制流的格式返回从图片里提取的出的图片暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *
主体识别 功能介绍 用户传入图片通过后台算法判断图片主体,并返回主体坐标,具体识别的主体请参考应用场景。 前提条件 使用主体识别服务之前需要您完成服务申请和认证鉴权。 图像识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调试 您可以在API Exp
道路运输证识别 功能介绍 识别道路运输证首页中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 道路运输证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆道路运输证的识别。
提取图片中的文字暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)的已嵌入文字暗水印的图片提取文字暗水印,支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过