检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节。 图1 飞机行程单示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 支持图像中行程单任意角度的水平旋转。 能处理反光、暗光等干扰的图片但影响识别精度。
增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
R服务使用简介章节。 图1 护照示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持中国大陆护照的全字段识别。 支持含有完整机读码的中国-港澳台地区及外国护照识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
发票、飞机行程单等。 优势 超级API 支持对各类卡证和票据的单张图像识别,也支持多种卡证票据的任意组合混贴场景的分类识别。 调用更加便捷 直接统一调用一个API即可完成对各种卡、证、票的识别,无需在调用时判断图像类型,也不用再对每种数据分别调用不同的API,降低了集成使用的复杂度。
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。
文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程
Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成
提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
详见停售公告。 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准。 支持识别JPG、PNG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 调用方法
多页PDF默认识别第一页。 图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 文字识别服务属
制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 银行卡示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 只支持识别银行卡正面,不支持识别背面。
使用OCR服务是否必须使用华为云存储图片 文字识别服务支持输入图片的base64编码或图片的url路径。 如果您使用图片的url路径,可以将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的图片url。 关于OBS的使用请参考配置OBS访问权限。 OCR识别OBS私有桶中的图片时需要保证调用
OCR服务支持上传图片后直接导出结果吗 目前OCR服务不支持上传图片后直接导出结果,需要通过调用API的方式使用。具体操作请参考《文字识别服务快速入门》。 父主题: 产品咨询类
Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。 开通OC
限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制 只支持泰国身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 泰国身份证识别图像各边的像素大小在15px到8192px之间。
识别机动车销售发票、二手车销售发票图片中的文字内容,服务能自动分辨两种类型,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 机动车销售发票示例图 图2 机动车销售发票示例图 图3 二手车销售发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。
识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。