个人征信的报告OCR识别方案.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个人征信的报告OCR识别方案

个人征信报告OCR识别 北京译图智讯科技有限公司一、 产品背景 3 1. 业务需求 3 2. 数据获取方案 4 二、 解决方案 5 1. 方案工作流程说明如下 5 2. 方案技术特点 6 三、 技术说明 7 产品背景 业务需求征信最、直观通过评估个人信用信用国内金融机构 目前个人征信从信中心打印,个人征信数据个人隐私信息不能对,人民银行信中心获取个人信用数据比较困难的,通过申请。 信用的个人从人民银行信官网查询打印的征信材料或者件机构,机构信用数据各自的风控模型中给予评级和额的的机构实际业务中如下问题: 审批,错过意向客户征信报告大,目前风控系统都需要录入个人信用的数据数据录入环节,方式,了信用的快速。,纸质信用报告转化到风控系统中的数据,效率关键 信用数据评估不,不全面隐含风险信用数据量大希望能放款,对势必疏漏判断这种情况因为,数据的获取和录入数据评估的精确对信贷业务会潜在的风险,影响贷款。 是从信贷审批一个,看出提高个人征信报告采集整个信贷活动的信贷部门效率客户的体验度,从而获取更多的信贷。 实际出发,获取个人征信的途径有说明如下: 对接人民银行征信目前了信企业征信,着机构从官方拿到信用数据如果从已的征信企业信用数据,有渠道,法律上应该; 从银行的结果中数据属于数据被篡改、数据不可信的 通过征信中心,打印个人的官方提供了查询打印平台,所以对消费者来说,最,也。报告是纸质版,将数据录入到系统中采集工作量。 机构都了贷款人个人提交征信报告扫描件,贷款还需要本人第三种方式中信用数据风控系统中的如何提高采集的效率信贷的所在多个实践,出一套依托于OCR字符识别)征信报告数据的,信贷机构提供高可靠性的信用数据 解决方案 方案工作流程说明如下 字符),通过处理手段,图像()文字、表格、图像转化为数据,快速实现数据的,大量的数据需要手工录入OCR技术将极大提高数据效率和准确度 解决方案下图所示: :客户面签,人员客户的征信图像扫描要求为DPI() :业务人员扫描的图像按顺序导入OCR自动软件软件自动特征和数据; 分析识别识别:版面、表格、文字分析征信表格部分、部分分析,所有的表格线并成,为之后的数据支撑分析对表格部分,分析并 识别结果校验和:中存在多种文字类型数据格式,识别后分析判断,二次,以提高识别精度 导出Excel/csv格式:对分析识别文字分析识别的结果进行组织和导出,原表格样式进行原版书 A.风控系统:风控系统和OCR系统之间,通过Excel/csv进行数据。系统改造即可使用识别出来数据。 速度快:的为征信耗时一份报告计算一份征信报告需要时间风控系统可以导入Excel数据,内,系统获得个人的人工录入录入一份报告的数据需要 数据详细OCR识别方式,将人详细的数据 数据精度高表明OCR技术比人工录入的精度要高,作业、疲劳高精度 表格原版式还原的OCR文字软件处理识别处理简单结构识别,OCR软件还需要制作模板才能识别,满足征信报告的表格识别本方案中,了检测自动识别的,经过实际测试,检测的准确率高达%。因为表格线检测精度高才可以表格原版式还原,一个结构和征信报告一样的 技术说明 在个人征信报告OCR方案中,技术点的技术点自动识别技术如下: 线图像处理技术只能检测固定长度、宽度表格线,检测技术受到局限,差。个人征信、、短线、细线相差非常大甚至有文字一样高度的竖线经我们优化后的检,适应性大大提高很好地检测报告表格线检测的,直接分析识别的效果。 线重构检测到的表格线重新组织成一个虚拟的,框线补齐、干扰框线多种情况。 判断文字类型的OCR识别的是混合方式,应用中混合识别,对数字、英文的识别精度本方案中,征信的特点,了二次判断,精确定义出每一个单元格中文字的,如数字类型,就使用数字类型去识别,的技术提高了识别的精度,保证了数字、日期、金额等类型更的识别效果 数据结构Excel技术:的OCR全文识别软件并不能很好的还原出Excel表格合并、分割等我们的表格线分析重构技术转换Excel的的还原,得到的就是和原稿电子。 ⑤导出Excel/csv格式 扫描征信 (图像存储) ②OCR自动 ③表格分析识别 ③文字分析识别 ④识别结果和汇总 A.风 控 系 统 数据转换 OCR自动识别系统

您可能关注的文档

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档