检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
径,例如D:\local\test.xlsx", response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip
泰国车牌识别 功能介绍 识别泰国车牌图片中的车牌信息,返回识别结果和车牌的区域位置信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 泰国车牌示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。
通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别 营业执照识别、名片识别 票据类 增值税
火车票识别 功能介绍 识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。
多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在15px到8192px之间。 支持单图多印章识别。 支持图像中印章任意角度的水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。 能处理反光、暗光等干扰的图片但影响识别精度。 调用方法 请参见如何调用API。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
件。 根据自身文字识别服务需求选择相应的POST类型。(OCR_idcard:身份证识别,OCR_auto_classification:智能分类识别,OCR-webimage:网络图片识别) 登录我的凭证,获取“华北-北京四”区域的项目ID,替换配置文件URL中的{project_id}。
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 响应参数 状态码:
Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 text_location Object 对应所有在原图上识别到的字段位置信息,包含所有文字区域四个顶点的二维坐标(x
飞机行程单识别 功能介绍 识别飞机行程单中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JP
机动车销售发票识别 功能介绍 识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
、TIFF格式的图片。 图像各边的像素在15到8192px之间。 支持多页同时识别。 能处理反光、暗光、水印等干扰的图片但影响识别精度。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用之前,需
Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 text_location Object 对应所有在原图上识别到的字段位置信息,包含所有文字区域四个顶点的二维坐标(x
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。