检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
、从左到右排列。 words为识别出来的文本内容,confidence表示该字段的置信度。 location表示文字块的区域位置信息,采用图像坐标系,第一个文字块左上角顶点为[140,45]。 extracted_data表示图片中包含的联系人信息,仅在设置了入参extract_
如果您是首次使用OCR的用户,建议您学习并了解如下信息: 功能介绍 通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别、证件类文字识别、票据类文字识别。 入门使用 OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。 使用方式 如
相关文档 1 文字识别服务上线 文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式,以JSON格式返回识别结果。 商用 -
detect_seal 否 Boolean 检测印章开关,开启时则返回单张票证是否含有印章,否则不返回是否含有印章。可选值包括: true:开启检测票证是否含有印章功能。 false:关闭检测票证是否含有印章功能。 说明: 该功能仅检测判断有无印章,不返回印章具体内容。 pdf_page_number
只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在100px到8192px之间。 图像中驾驶证区域有效占比超过50%,保证整张驾驶证内容及其边缘包含在图像内。 支持图像中驾驶证任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的驾驶证长宽比与实际驾驶证相差不超过10%。
只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。
页码。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 单页字符数不大于1800,以获得较优的识别效果。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文档解析。
F、GIF、WEBP格式图片。 图像各边的像素大小在100px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。
在“文字识别控制台>自定义OCR”页面选择“通用单模板工作流”创建应用,详细操作请见6.2 新建应用。您可以创建单模板服务,通过模板配置文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前
只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中护照首页区域有效占比超过25%,保证护照首页内容及其边缘包含在图像内。 支持图像中护照任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的护照长宽比与实际护照相差不超过10%。 能
OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式
概述 文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interfac
服务韧性 OCR提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
图片包含联系人信息,也支持联系人信息的提取,同时可供进一步的数据挖掘后处理操作。 印章识别 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。 应用场景 纸质文件电子化 自动识别结构化信息与提取签名盖章区域,有助快速审核。
支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF默认识别第一页,或者您可以指定要识别的页码。 图像各边的像素大小在100px到8192px之间。 图像中发票区域有效占比超过80%。 支持图像中增值税发票任意角度的水平旋转。 图片中发票宽高比例与真实发票比例一致。 支持增值税专用发票
发日期、业户地址、经济类型、经营许可证号、经营范围等关键字段。 该接口的应用场景广泛,可应用于营运车辆合法经营性证明、车辆运输违章检测等场景,自动检测和识别道路运输证信息,降低人工录入成本,实现道路运输监控的智能化,同时降低用户使用失效、伪造的道路运输证的侥幸心理,打造良好安全的道路运输环境。
操作步骤 登录API Explorer。 登录后,“X-Auth-Token”和“project_id”参数会自动填充,无需填写。 填写待检测图片数据。 输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-
在多模板应用中,为了获得较好的分类效果,还应该框选各个模板中有独有的参照字段。 如果不确定哪些文字是参照字段,或是想快速评估模板效果的,可以跳过"框选参照字段"流程,当后台检测到模板没有配置任何参照字段时,会自动寻找合适的参照字段进行识别,此功能可以提高项目开发与验证的效率。 父主题: 常见问题
/v2/{project_id}/ocr/acceptance-bill 防疫健康码识别 POST /v2/{project_id}/ocr/health-code 核酸检测记录识别 POST /v2/{project_id}/ocr/pcr-test-record 泰文身份证识别 POST /v2/{proj
识别图片上的文字内容,并返回识别的文字和坐标。 网络图片识别 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 智能分类识别 检测定位图片上指定要识别的票证(票据、证件或其他文字载体),并以JSON格式返回识别的结构化结果。 手写文字识别 识别手写文字图片中的文字内容。