检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
未实名认证
已实名认证
OCR简介文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。
OCR简介
文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。
OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。
通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。
证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。
票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。
行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。
定制模板OCR(Custom OCR),支持用户自定义识别模板,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。
受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。
Ø 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
Ø 图像各边的像素大小在15px到8192px之间。
Ø 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
Ø 支持图像任意角度的水平旋转。
Ø 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
Ø 支持中英文以及部分繁体字。
Ø 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
Ø只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
Ø图像各边的像素大小在15px到8192px之间。
Ø图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
Ø支持图像任意角度的水平旋转。
Ø目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。
Ø支持中英文以及部分繁体字。
Ø文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
Ø支持中英文及部分中文繁体字。
Ø只支持识别JPG、JPEG、PNG、BMP、TIFF、GIF、WEBP格式图片。
Ø支持常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。
Ø图像各边的像素大小在15到8192px之间。
Ø图像中有效文字图片占比超过60%,避免有效文字图片占比过小。
Ø支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。
Ø图像各边的像素大小在15到8000px之间。
Ø支持图像中票证任意角度的水平旋转。
Ø文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们
Ø支持图像任意角度的水平旋转(需开启方向检测)。
Ø目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
Ø支持中华人民共和国居民身份证的识别。
Ø图像中身份证区域有效占比超过25%,保证整张身份证内容及其边缘包含在图像内。
Ø支持图像中身份证任意角度的水平旋转。
Ø支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。
Ø能处理反光、暗光等干扰的图片但影响识别精度。
Ø目前只支持识别单张身份证的正面或者反面。
Ø只支持中国大陆驾驶证的识别。
Ø图像各边的像素大小在100到8000px之间。
Ø图像中驾驶证区域有效占比超过50%,保证整张驾驶证内容及其边缘包含在图像内。
Ø支持图像中驾驶证任意角度的水平旋转。
Ø支持少量扭曲,扭曲后图像中的驾驶证长宽比与实际驾驶证相差不超过10%。
Ø能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
Ø只支持中国大陆行驶证的识别。
Ø支持图像中行驶证任意角度的水平旋转。
Ø支持少量扭曲,扭曲后图像中的行驶证长宽比与实际行驶证相差不超过10%。
Ø目前只支持识别2008年版的行驶证。
Ø支持各国护照识别,根据护照首页下方的机读码提取信息。
Ø图像各边的像素大小在15到4096px之间。
Ø图像中护照首页区域有效占比超过25%,保证护照首页内容及其边缘包含在图像内。
Ø支持图像中护照任意角度的水平旋转。
Ø支持少量扭曲,扭曲后图像中的护照长宽比与实际护照相差不超过10%。
Ø只支持识别JPG、JPEG、PNG、BMP、TIFF格式的图片。
Ø只支持识别银行卡正面,不支持识别背面。
Ø只支持识别85.60×53.98 mm常规大小的银行卡,不支持迷你卡和形状不规则的异形卡。
Ø支持图像中银行卡任意角度的水平旋转。
Ø图像各边的像素在15到8192px之间。
Ø图像中营业执照区域有效占比超过70%,保证整张营业执照及其边缘包含在图像内。
Ø支持图像中营业执照旋转、支持少量扭曲。
Ø能处理暗光等干扰的图片但影响识别精度。
Ø 只支持中国大陆道路运输证的识别。
Ø 图像各边的像素大小在15到4096px之间。
Ø 支持图像中道路运输证任意角度的水平旋转。
Ø 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
Ø推荐图像中车牌清晰无遮挡、正面放置无倾斜。
Ø目前支持车牌类型含小型汽车、小型新能源、大型新能源、使馆汽车、领馆汽车、港澳入出境汽车、教练汽车、警用汽车号牌,暂不支持双行号牌。
Ø图像中名片的有效占比超过60%,保证整张名片内容包含在图像内。
Ø支持图像中名片的任意角度的水平旋转(需开启方向检测)。
Ø 支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF仅识别第一页。
Ø 图像各边的像素大小在100到8192px之间。
Ø 图像中发票区域有效占比超过80%。
Ø 支持图像中增值税发票任意角度的水平旋转。
Ø 图片中发票宽高比例与真实发票比例一致。
Ø 目前只支持中华人民共和国境内的增值税发票识别。
Ø 支持增值税专用发票和增值税普通发票(含电子普通发票),包括增值税普通发票中的卷式发票、通行费发票。
Ø 支持增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票,共计9种发票发票发票 信息核验。
Ø 每份发票每天最多可查验5次。可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。
Ø 图像各边的像素大小在100到8000px之间。
Ø 图像中识别区域有效占比超过80%,保证整张发票及其边缘包含在图像内。
Ø 支持图像中发票任意角度的水平旋转。
Ø 支持少量扭曲,扭曲后图像中的发票长宽比与实际发票相差不超过10%。
Ø 图像中发票区域有效占比超过25%,保证整张发票内容及其边缘包含在图像内。
Ø 支持图像中出租车发票任意角度的水平旋转。
Ø 图像中发票区域有效占比超过25%。
Ø 支持图像中车辆通行费发票任意角度的水平旋转。
Ø 目前只支持中华人民共和国境内的车辆通行费发票识别。
Ø 图像各边的像素大小在15到8192px之间。
Ø 支持图像中行程单任意角度的水平旋转。
Ø 能处理反光、暗光等干扰的图片但影响识别精度。
Ø 图像中火车票区域有效占比超过25%。
Ø 支持图像中火车票任意角度的水平旋转。
Ø 支持少量扭曲,扭曲后图像中的火车票长宽比与实际火车票相差不超过10%。
Ø 图像各边的像素在15到8192px之间。
Ø 图像中保险单区域有效占比超过70%,保证整张保险单及其边缘包含在图像内。
Ø 支持图像中保险单旋转、支持少量扭曲。
Ø 能处理暗光等干扰的图片但影响识别精度。
Ø 覆盖常见保险公司的常见保单版式,由于即使是同一家保险公司,保险种类也繁多而且都在动态变化,实际支持情况请以实际测试效果为准。
Ø 支持全国不同地区健康码的识别。
Ø 图像各边的像素大小在15到8000px之间。
Ø 图像中健康码区域有效占比超过80%,保证整张健康码内容及其边缘包含在图像内。
Ø 推荐采用手机截图图像。
Ø 支持图像中健康码任意角度的水平旋转(需开启方向检测)。
Ø 目前只支持识别单张健康码。
采用直播教学+技术干货形式,扫除OCR服务实际应用的问题,实现人人快速上手操作。
您将学习到行业深度应用的AI领域知识:OCR与NLP的概念及其模型开发,同时您也可以选择体验和学习当下热门的端云协同AI应用开发.
通过本课程的学习,了解文字识别的特性、解决方案等,并掌握其申请和使用方法。