文字识别 OCR-识别字符出现错误如何优化?

时间:2024-11-07 17:17:47

识别字符出现错误如何优化?

不同的错误情形需要具体分析:

情形1:大部分 文字识别 正确,部分形近符号的识别错误。

解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中使用字符串替换、正则抽取等规则来修正识别结果。

情形2:单模板工作流识别出错,且大部分字段为空或错误。

解决办法:请检查参照字段是否框选正确,或尝试框选更多参照字段(框选办法参照框选参照字段),如果新增参照字段后仍有问题,请检查识别图片与模板图片是否为同一个版式,如果为新版式,请考虑创建新模板或使用多模板分类工作流。

情形3:多模板识别工作流出错,大部分字段为空或错误。

解决办法:先检查分类结果是否正确(返回结果中的template_id表示分类结果),若分类错误,则说明分类器中存在相似的模板导致分类出错,请在参照字段中添加模板特有的参照字段,从而提高分类的鉴别能力。若分类结果正确,但识别结果错误,请参照情形2的解决办法。

support.huaweicloud.com/usermanual-ocr/ocr_08_0048.html