人行个人信用报告OCR解析-深源恒际科技有限公司-
版本: V1.0 | 交付方式: API |
适用于: 其他 | 上架日期: 2019-11-07 07:10:19 |
注意事项:
1代、2代征信报告接口上传的请求参数为:urlencode格式的PDF版征信报告的base64编码数据;
授信机构版征信报告接口上传的请求参数为:urlencode格式的HTML版征信报告的base64编码数据。
因商城限制,上传的请求数据大小不超过2M,如超过2M,可联系客服解决。
具体调试方式与编码转译,可下载参考使用指南。
简介:在处理借贷业务时,信贷机构会通过用户既往信用记录分析、判断用户还款意愿,以便预见性地规避风险、减小坏账率。然而,由于征信信息涉及个人隐私,央行征信中心不面向第三方机构开放征信数据,同时,在复杂的竞合关系下,各信贷平台也常常对打通信息孤岛共享数据持观望态度,导致信贷机构获取用户信用信息的门槛相对较高。目前,办理贷款业务时,信贷机构只能在获得用户授权的情况下从央行征信中心调用征信报告,以便获得用户信用信息。拿到报告后,需要通过人工方式把核心信息一一录入风控模型,用于分析、评估潜在风险,进而作出相应决策。
问题在于,人工录入作业量大、相对耗时,难免影响贷款审批效率,造成意向客户的流失;抑或为实现快速放款,业务部门处理征信数据时删繁就简,因疏漏或主观判断造成风险评估不够精准。
基于这一现状,深源恒际推出征信报告信息结构化提取 解决方案 ,帮助借贷平台提升服务效率、降低人力成本。基于OCR识别技术,结合专项训练和自适应提取方法,深源恒际开发了征信报告专用识别模型,可自动识别、提取征信报告上的文字信息,并输出结构化文本,实现信息采录 自动化 。
在实际应用场景下,会出现诸多干扰识别效果的因素,如文本不清晰、旋转畸变等。测试数据显示,基于OCR完成整份征信报告的识别录入,用时约为20s-30s;而人工录入整份报告耗时约1-2小时,作业效率大幅提升。另外,在识别精度上,算法模型的字段准确率已达99%。
OCR技术在信贷业务中的应用,实现了征信报告识别录入自动化,优化业务流程的同时,也提升了业务处理效率,让信贷服务能够更加高效、便捷地触达用户。