检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Object 各个字段的置信度。 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时不返回此字段。 error_msg String 调用失败时的错误信息。 调用成功时无此字段。 请求示例
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。
方案概述 应用场景 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。支持增值税发票、增值税
销货清单的购买方名称。 当传入图片为发票销货清单时返回此字段。 belong_seller_name String 销货清单的销售方名称。 当传入图片为发票销货清单时返回此字段。 belong_vat_code String 所属的增值税发票代码。 当传入图片为发票销货清单时返回此字段。 belong_number
仅在输入参数return_portrait_image为true时,返回该字段。 当输入为身份证背面时返回为空字符串。 adjusted_image String 身份证卡面图片信息的base64码结果。 说明: 仅在输入参数return_adjusted_image为true时,返回该字段。 verification_result
数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。 columns Array of integers 文字块占用的列信息,编号从0开始,列表形式,数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。 cell_location
流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。
现各种文档电子化。 证件类 OCR 证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。 票据类 OCR 票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。
图2 编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“模板总览”、“评估”、“调用指南”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 父主题:
返回此字段。 name String 名。当响应字段"side"为front时,返回此字段。 last_name String 姓。当响应字段"side"为front时,返回此字段。 birth_date String 出生日期。 birth_place String 出生地。 gender
confidence Object 字段的置信度,取值范围0~1。 置信度越大,本次识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 说明: 置信度中的相关字段均与返回值中的相关字段一一对应。 状态码: 400 表6 响应Body参数
FinancialStatementWordsRegionList 参数 参数类型 描述 type String 区域属性:文本或表格。 words_block_count Float 检测到的文字块数目。对文本区,文字块以文本字段为单位;对表格区,文字块以单元格内所有字段为单位。 table_location
检测框对象,内部为字段-框坐标对。如 code:[[x0, y0],[x1,y1],[x2,y2],[x3,y3]], 点的顺序是左上角、右上角、右下角、左下角。如果原图找不到字段,返回空列表。 confidence Object 字段文字内容置信度,内容为字段-字符置信度对,如code:0
”。 图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新编辑模板。操作指引如下: 上传模板图片 定义预处理 6.3.4-框选参照字段 6.3.5-框选识别区 6.3.6-评估 6.3.7-调用指南
银行卡类别,如:借记卡,信用卡,准贷记卡,预付费卡。 如果参数返回为空,表示未识别到银行卡类别。 confidence Object 字段的置信度,取值范围0~1。 置信度越大,表示识别的字段的可靠性越高,在统计意义上,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段的准确率。 text_location
“删除”:单击“删除”,弹出“确认删除”对话框,单击“确认”,删除当前模板。 在“应用资产>自定义字段类型”页面下,可以查看自己定义的字段类型,也可单击“创建字段类型”,在此处创建新的字段类型,详情请见自定义字段类型。 父主题: 自定义OCR
words_ids Array of integers 文字识别结果索引列表,表示ocr_result的words_block_list中哪些文本框位于该文档区域内。 table_id Integer 仅当type为"table"且入参table为True时返回该字段,表示当
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.getenv("CLOUD_SDK_AK") sk = os.getenv("CLOUD_SDK_SK")
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.getenv("CLOUD_SDK_AK") sk = os.getenv("CLOUD_SDK_SK")