检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Object 各个字段的置信度。 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时不返回此字段。 error_msg String 调用失败时的错误信息。 调用成功时无此字段。 请求示例
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
仅在输入参数return_portrait_image为true时,返回该字段。 当输入为身份证背面时返回为空字符串。 adjusted_image String 身份证卡面图片信息的base64码结果。 说明: 仅在输入参数return_adjusted_image为true时,返回该字段。 verification_result
方案概述 应用场景 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。支持增值税发票、增值税
数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。 columns Array of integers 文字块占用的列信息,编号从0开始,列表形式,数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。 cell_location
流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。
FinancialStatementWordsRegionList 参数 参数类型 描述 type String 区域属性:文本或表格。 words_block_count Float 检测到的文字块数目。对文本区,文字块以文本字段为单位;对表格区,文字块以单元格内所有字段为单位。 table_location
现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。 票据类 OCR 票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。
图2 编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 父主题:
”。 图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3.5-框选识别区 6.3.6-评估 6.3.7-调用指南
销货清单的购买方名称。 当传入图片为发票销货清单时返回此字段。 belong_seller_name String 销货清单的销售方名称。 当传入图片为发票销货清单时返回此字段。 belong_vat_code String 所属的增值税发票代码。 当传入图片为发票销货清单时返回此字段。 belong_number
words_ids Array of integers 文字识别结果索引列表,表示ocr_result的words_block_list中哪些文本框位于该文档区域内。 table_id Integer 仅当type为"table"且入参table为True时返回该字段,表示当
“删除”:单击“删除”,弹出“确认删除”对话框,单击“确认”,删除当前模板。 在“应用资产>自定义字段类型”页面下,可以查看自己定义的字段类型,也可单击“创建字段类型”,在此处创建新的字段类型,详情请见自定义字段类型。 父主题: 自定义OCR
返回此字段。 name String 名。当响应字段"side"为front时,返回此字段。 last_name String 姓。当响应字段"side"为front时,返回此字段。 birth_date String 出生日期。 birth_place String 出生地。 gender
amount_in_words String 大写票据金额。 旧版退票 confidence Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 共享字段 text_location
自动识别机动车销售发票和二手车销售发票图片内的文本内容,并自动分辨两种类型返回结构化字段信息,用于后续的进一步处理,节省大量的人工录入成本。 承兑汇票 自动识别出承兑汇票图片中的关键字段, 并返回结构化字段信息。 银行回单识别 自动识别100+不同版式银行回单的全部信息,包括付款人、收款人相关账号、金额及交易信息等。
模板种类固定,识别不在多模板中的图片可能会返回错误的结果或无法识别。 模板间有足够的区分度,不同模板要有不同的参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。 模板数量可穷举,建议不超过20种模板,过多的模板会降低分类效果(以实际测试为准,模板差异较大时允许支持更多模板)。
化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 示例发票 示例结果 发票识别与验真结果如下所示,'status'字段为'valid',表示该发票有效,返回参数的详细介绍,请参见增值税发票识别 API参考、发票验真 API参考。 { 'type': 'vat_normal_electronic'
例如,网络图片识别URI部分,您可以看到其请求方法为“POST”,则其请求为: POST https://ocr.cn-north-4.myhuaweicloud.com/v2/{project_id}/ocr/web-image 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体