检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
填写字段类型信息。 图1 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例
字段类型 在“框选识别区”页面,可以给每个字段指定字段类型来提高识别准确率,或是将文字识别结果处理成业务需要的格式。勾选字段类型后,后台会对文字识别结果进行相应的处理后再输出。每个识别区可选择多个字段类型,多个字段类型会按照勾选顺序执行。自定义OCR控制台提供了默认字段类型和自定义字段类型两种功能。
默认字段类型 当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后,将会按照指定的字段类型对字符串处理后再输出。比如,未激活任何字段类型时的输出为“发证日期:2021年09月12日”,为了精准提取日期
基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
模板,最后通过参照字段的位置来校正待识别图片。 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。
字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数
字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
当“detect_direction”为“true”时,该字段有效。返回图片逆时针旋转角度,值区间为0~359。 当“detect_direction”为“false”时,该字段值为 -1。 words_block_count Integer 检测到的文字块数目。 words_block_list Array
解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中使用字符串替换、正则抽取等规则来修正识别结果。 情形2:单模板工作流识别出错,且大部分字段为空或错误。 解决办法:
覆盖常见保险公司的常见保单版式,支持对保险单中的23个关键字段进行结构化识别,包括发卡行、保险单号、保险公司、保险单生效日期、投保人姓名、投保人性别、投保人出生日期、投保人证件类型、投保人证件号、被保人列表、被保人性别、被保人证件类型、被保人证件号、受益人姓名、受益人类型、受益顺序、受益比例、产品名称、保
进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别 场景三:不同类型发票识别 识别类型 卡证类 目前支持的卡证类包含:身份证
接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 智能分类示例图 表1 支持票证类型 票证类型 增值税发票(支持识别电子版) 增值税发票(销货清单) 通用机打发票
ModelArts4204服务未开通报错 02:31 ModelArts4204服务未开通报错 文字识别 OCR 非支持的图片类型报错 01:59 非支持的图片类型报错
以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表
ey值为"contact_info"的字段、"image_size"字段。 若入参extract_type为空列表或该字段缺失时,不进行提取,此字段为空。 表6 WebImageWordsBlockList 参数 参数类型 描述 words String 文字块识别结果。 confidence
响应Body参数 参数 参数类型 描述 result VatInvoiceResult object 识别结果。 调用失败时不返回此字段。 表5 VatInvoiceResult 参数 参数类型 描述 title String 增值税发票标题。 type String 增值税发票类型: special:增值税专用发票
需要识别的图片都属于同一类型的模板。同一类模板的图片,它们有相同的版面排布,且要识别的文字类型和位置均要求固定。如果您的图片具有多种模板,请考虑使用“多模板工作流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票
响应Body参数 参数 参数类型 描述 result PassportResult object 识别结果。 调用失败时不返回此字段。 该结果中包含:13个主要字段,由英文表达;extra_info由本地官方语言表达;主要字段的置信度。置信度越大,字段的值越准确。 表5 PassportResult