检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Boolean 可选值包括: true:输入图像仅包含有线表格,仅进行有线表格识别。 false: 输入图像可能包含无线表格,同时进行有线表格与无线表格识别。 未传入该参数时默认为false,即同时进行有线表格与无线表格识别。当确认输入仅包含有线表格时,该参数设为true可达到更优识别效果。 响应参数
构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 智能分类示例图 表1 支持票证类型
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result WebImageResult object 调用成功时表示调用结果。 调用失败时无此字段。 表5 WebImageResult
图片。 图像各边的像素大小在15px到8192px之间。 只支持识别银行卡正面,不支持识别背面。 只支持识别85.60×53.98 mm常规大小的银行卡,不支持迷你卡和形状不规则的异形卡。 支持图像中银行卡任意角度的水平旋转。 调用方法 请参见如何调用API。 前提条件 在使用之
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result GeneralTextResult object 识别结果。 调用失败时不返回此字段。 表5 GeneralTextResult
本节定义了文字识别服务上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供管理控制台或API接口来检索文字识别服务产生的监控指标和告警信息。 命名空间 SYS.OCR 监控指标详情 表1 OCR支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象
单元格行信息,列表形式。多个连续值表示单元格垮多行。 columns Array of integers 单元格列信息,列表形式。多个连续值表示单元格垮多列。 cell_location Array<Array<Integer>> 单元格位置信息,列表形式,分别表示单元格4个顶点的x
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VehicleLicenseResult object 识别结果。 调用失败时不返回此字段。 表5 VehicleLicenseResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result Array of LicensePlateResult objects 识别结果。 调用失败时不返回此字段。 表5 LicensePlateResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result IDCardResult object 识别结果。 调用失败时不返回此字段。 表5 IdCardResult
通用类 功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result DriverLicenseResult object 识别结果。 调用失败时不返回此字段。 表5 DriverLicenseResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VatInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 VatInvoiceResult
保险单识别 财务报表识别 道路运输从业资格证识别 通用表格识别 支持对图片中的所有表格文字信息进行识别和提取,可识别常规表格及合并单元格表格中的中英文和部分繁体字。能够返回文本块坐标及单元格坐标信息,方便用户进行版式的二次处理以及提高人工校验效率。 该接口可应用于信息登记表识别场景,对
图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 调用方法 请参见如何调用API。 前提条件 在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。
None 服务介绍 文字识别 OCR 文字识别技术简介 01:46 文字识别技术简介 快速入门 文字识别 OCR 使用SDK 06:38 SDK使用指导 文字识别 OCR 使用API 03:04 API使用指导 问题排查 文字识别 OCR 获取Token时帐密报错 03:53 获取Token时帐密报错
票据类 功能介绍 增值税发票识别 通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,用于后续的进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片内的文本内容,并返回结
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result HandwritingResult object 识别结果。 调用失败时不返回此字段。 表5 HandwritingResult
资源和成本规划 该解决方案主要部署如下资源,需要的产品列表和配置示例如表1、表2所示,以下花费仅供参考。 表1 产品配置说明 产品 配置示例 文字识别服务 区域:华北-北京四 计费模式:按需计费 涉及服务:增值税发票识别、发票验真 对象存储服务 区域:华北-北京四 计费模式:按需计费
ocr:generalTable:subscribe 开通通用表格识别服务 √ × ocr:generalTable:unsubscribe 取消开通通用表格识别服务 √ × ocr:generalTable:getSubscribeUserList 查询开通通用表格识别的用户列表 √ √ ocr:genera