检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
见OCR自定义模板下线公告。 功能介绍 自定义模板OCR,支持用户自定义模板,对于版式固定的各种票据和卡证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。 约束与限制 只支持识别PNG、JPG、PNG、BMP、TIFF、GIF、WEBP格式图片。
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
什么情况下可以使用自定义模板? 自定义模板是一款用于提取卡证、票据和文档图片中自定义区域信息的文字识别产品。当您要识别的证件或票据种类不在华为云OCR API支持之中,并且识别图片的版式固定,则可以使用本产品提取自定义版式、自定义区域的文字信息。比如,目前华为云尚未推出毕业证书识
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
true:返回文本块和单元格坐标; false:不返回。 未传入该参数时默认为false,即不返回。 return_confidence 否 Boolean 返回字段识别置信度,小数点后四位。可选值包括: true:返回字段置信度; false:不返回。 未传入该参数时默认为false,即不返回字段置信度。
营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。
拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板,最后通过参照字段的位置来校正待识别图片。 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8
期;资源到期而未续费时,将陆续进入宽限期和保留期。 图1 套餐包OCR资源生命周期 到期预警 套餐包OCR资源在到期前第7天内,系统将向用户推送到期预警消息。预警消息将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 到期后影响 当您的套餐包OCR资源到期未续费,首先会进入
IAM用户的Token。详细说明请参见帐密报错。 Token可通过调用“获取用户Token”接口获取,调用本服务API需要project级别的Token,即调用获取用户Token接口时,请求body中“auth.scope”的取值需要选择“project”,请求示例如下所示。 u
保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。对于多模板应用而言,参照字段还将用于区分不同的模板。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区
使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“应用开
使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“应用开
在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。 父主题: 计费FAQ
增值税普通发票、增值税电子普通发票以及增值税普通发票(卷票)四种类型发票的识别与验真。 网络货运 该实践基于华为云文字识别 OCR和人证核身服务 IVS AI技术构建,提供了一个开箱即用的网络货运认证解决方案,支持以下六种场景:身份证、行驶证、驾驶证、道路运输证、道路运输从业资格证的审查和人证核身。
监控 文字识别的监控指标 查看监控指标
余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。 框选参照字段 框选识别区 在图片模板中框选识别区,确定模板图片中需要识别的文字位置。 框选识别区 评估 通过上传
识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别