检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别套件 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
出租车发票识别 功能介绍 识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J
果,帮助用户自动进行人脸的识别、比对以及相似度查询等,打造智能化业务系统,提升业务效率。 当前人脸识别提供了以下子服务: 人脸检测 人脸比对 人脸搜索 活体检测 人脸检测 人脸检测是在图像中准确识别出人脸的位置和大小。用户通过该服务,可以同时识别出图片中包含的不同倾角正脸及侧脸。
电子面单识别 OCR电子面单识别将于2025.02.18正式停售,为避免影响您目前的业务,请您及时进行相关迁移工作,详见停售公告。 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
图解文字识别
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。
银行卡的类别,如:储蓄卡,信用卡。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表3所示。 表3 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径 图片的URL路径,和图片文件二选一。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用O
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
件格式返回至另一个OBS桶中。 使用函数工作流 FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用
营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。
车辆通行费发票识别 功能介绍 识别车辆通行费发票中的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持
文字识别的监控指标 功能说明 本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
开始使用 1、网络图片识别:支持图片格式等约束信息详网络图片识别文档 2、电子面单识别:支持图片格式等约束信息详电子面单识别文档 登录对象存储服务 OBS控制台,在桶列表选择快速部署 步骤三创建的用于上传快递图片的OBS桶,可直接上传图片或上传压缩包(支持zip及tar格式),如
户口本识别 功能介绍 识别户口本中的文字信息,并返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
飞机行程单识别 功能介绍 识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JP