检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填写连接器的描述信息,用于识别不同的连接器。 支持的操作 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
火车票识别 功能介绍 识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
不动产证识别 功能介绍 识别不动产证中的文字信息,并返回识别的结构化结果。 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。
FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息的截图上传至OBS桶,即可自动识别提取收/
提取图片中的文字暗水印(文件地址版本) 功能介绍 对指定存储地址信息(目前支持OBS)的已嵌入文字暗水印的图片提取文字暗水印,支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib, *.rle, *.tiff, *.tif, *.ppm
营业执照识别 功能介绍 识别营业执照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 营业执照示例图 图2 营业执照示例图-横版 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片及PDF。
在Postman左侧导航栏中单击“OCR_idcard”配置文件。 根据自身文字识别服务需求选择相应的POST类型。(OCR_idcard:身份证识别,OCR_auto_classification:智能分类识别,OCR-webimage:网络图片识别) 登录我的凭证,获取“华北-北京四”区域的项目ID
图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
出租车发票识别 功能介绍 识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J
通用文字识别:提取图片内的文字及其对应位置信息。 手写文字识别:识别手写文字、印刷文字信息。 网络图片识别:识别网络图片内的所有文字及其对应位置信息。 证件类 身份证识别、护照识别、银行卡识别 驾驶证识别、行驶证识别、道路运输证识别、车牌识别、VIN码识别 营业执照识别、名片识别 票据类 增值税发票识
靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。
发票识别与验真 方案概述 资源和成本规划 实施步骤
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
识别输入图片中的车牌信息,并返回其坐标和内容 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 车辆通行费发票识别 识别车辆通行费发票中的文字信息,并返回识别的结构化结果。 银行卡识别
银行卡的类别,如:储蓄卡,信用卡。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表3所示。 表3 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径 图片的URL路径,和图片文件二选一。
图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线图片作为测试图片。
如何在含有多张人脸的图片中实现多人脸识别 当前人脸识别服务中,如果传入的图片中包含多个人脸,则只能选取最大的一个人脸进行识别。但是可以使用如下方法,实现一张图片中多张人脸的识别(比对/搜索): 调用人脸检测接口,可以得到多张人脸在图片中的像素位置。 通过获取到的人脸位置信息,从原
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
哥伦比亚身份证识别 功能介绍 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 约束与限制 支持哥伦比亚身份证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过8