检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
默认字段类型 当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后,将会按照指定的字段类型对字符串处理后再输出。比如,未激活任何字段类型时的输出为“发证日期:2021年09月12日”,为了精准提取日期
填写字段类型信息。 图1 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例
基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。
字段类型 在“框选识别区”页面,可以给每个字段指定字段类型来提高识别准确率,或是将文字识别结果处理成业务需要的格式。勾选字段类型后,后台会对文字识别结果进行相应的处理后再输出。每个识别区可选择多个字段类型,多个字段类型会按照勾选顺序执行。自定义OCR控制台提供了默认字段类型和自定义字段类型两种功能。
模板,最后通过参照字段的位置来校正待识别图片。 基本概念 参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。 套件提供了自动搜索参照字段和手动框选参照字段这两种模式。 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。
object 识别结果。 调用失败时不返回此字段。 表5 GeneralTextResult 参数 参数类型 描述 direction Float 图片朝向。 当“detect_direction”为“true”时,该字段有效。返回图片逆时针旋转角度,值区间为0~359。 当“detect_
解决办法:请检查参照字段是否框选正确,或尝试框选更多参照字段(框选办法参照框选参照字段),如果新增参照字段后仍有问题,请检查识别图片与模板图片是否为同一个版式,如果为新版式,请考虑创建新模板或使用多模板分类工作流。 情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类
文字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“
文字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“
低人工成本。 支持区域: 华北-北京四 华东-上海一 驾驶证识别API 护照识别 支持对中国护照及外国护照的关键字段信息进行结构化识别。其中,中国护照支持所有关键字段识别,包括国家码、国籍、护照号码、护照类型、姓名、姓名拼音、性别、出生地点、出生日期、签发地点、签发日期、有效期、
否 String 输入值为护照颁发国的国家码,根据国家码选择对应的护照识别服务。 若输入中未选此字段,服务会根据自己识别判断的护照类型匹配相应的护照识别服务。 若选择值为“GENERAL”,则选择护照机器码识别。 若选择值为“CHN”,则选择中国护照全字段识别。 响应参数 根据识
自动识别出车辆合格证图片的文本内容,并返回结构化字段信息。 不动产证 自动识别出不动产证图片的文本内容,并返回结构化字段信息。 哥伦比亚身份证 识别哥伦比亚身份证中的文字信息,并将识别的结构化结果返回给用户。 应用场景 认证场景 核验用户是否为真实证件的持有者本人。 证件信息录入 识别
增值税发票识别支持哪些发票 目前已经支持增值税专用发票和增值税普通发票(含电子普通发票)。卷式发票和通行费发票即将上线,并且支持发票备注、监制章、专用章、发票联次等字段。具体请参见增值税发票识别章节。 父主题: 产品咨询类
识别结果后处理 提取特定字段导入Excel 本示例调用身份证识别API,并从获取到的JSON结果中,提取所需的字段,填入至Excel。 前提条件 开通身份证识别。 参考本地调用,安装OCR Python SDK。并执行pip install xlsxwriter命令安装依赖包。
调用失败时无此字段。 template_id String 调用成功时返回调用模板id。 调用失败时无此字段。 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时无此字段。 error_msg
Boolean 为Boolean类型,若不传该字段,默认不检测切片字体,为True时,将检测切片的字体类型,并返回最相似的5种字体名称。 detect_text_direction 否 Boolean 为Boolean类型,若不传该字段,默认为True,即检测每个字段的文字方向。为Fals
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用。 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求。