检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。 票据类 OCR
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VehicleLicenseResult object 识别结果。 调用失败时不返回此字段。 表5 VehicleLicenseResult
在“模板列表”页签,选择模板名称,单击操作列的“编辑”。 图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result IDCardResult object 识别结果。 调用失败时不返回此字段。 表5 IdCardResult
进入“应用资产”页面。 图1 进入应用资产 在“模板列表”页签,选择模板名称,单击操作列的“编辑”。 图2 编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下:
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
您只需要在API Explorer中修改接口参数,即可自动生成对应的代码示例。同时,可在集成开发环境CloudIDE中完成代码的构建、调试、运行等操作。 图1 API Explorer 与API的对应关系 文字识别接口与API对应关系请参见表2。 表2 接口与API对应关系表 接口 API 智能文档解析
基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
Integer 识别出来的表格、文本区域个数。 words_region_list Array of FinancialStatementWordsRegionList objects 返回的表格、文本区域列表。输出顺序从左到右,从上到下。 excel String 表格图像转换为exc
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VatInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 VatInvoiceResult
number String 卡证编号。当响应字段"side"为front时,返回此字段。 name String 名。当响应字段"side"为front时,返回此字段。 last_name String 姓。当响应字段"side"为front时,返回此字段。 birth_date String
confidence Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 说明: 置信度中的相关字段均与返回值中的相关字段一一对应。 状态码: 400 表6 响应Body参数 参数
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result TrainTicketResult object 识别结果。 调用失败时不返回此字段。 表5 TrainTicketResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result MvsInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 MvsInvoiceResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result TollInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 TollInvoiceResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result BankcardResult object 识别结果。 调用失败时不返回此字段。 表5 BankcardResult
code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result TaxiInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 TaxiInvoiceResult
e为True时返回该字段,表示当前逻辑表格区域对应table_result中哪一项识别结果。 form_id Integer 仅当type为"form"且入参form为True时返回该字段,表示当前有线表单区域对应form_result中哪一项识别结果。 表14 SmartDoc
自动识别机动车销售发票和二手车销售发票图片内的文本内容,并自动分辨两种类型返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。 承兑汇票 自动识别出承兑汇票图片中的关键字段, 并返回结构化字段信息。 银行回单识别 自动识别100+不同版式银行回单的全部信息,包括付款人、收款人相关账号、金额及交易信息等。