基于关联规则挖掘信用卡欺诈研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则挖掘信用卡欺诈研究

基于关联规则挖掘信用卡欺诈研究   摘要:关联规则分析作为数据挖掘中一个重要的组成部分,能够有效发现大量数据中相关属性集之间有意义的关联关系,从而为政策或规则的制定提供参考依据。近年来,关联规则分析已被广泛应用到零售、物流、信用卡营销及风险管理等众多领域。基于此,从介绍关联规则分析的基本概念出发,以德国信用卡为例,使用Intelligent Miner软件,探讨信用卡持卡人信用卡欺诈所具有的一般特性,对提升业务风险管理技术有所裨益。   关键词:关联规则挖掘;信用卡欺诈;风险管理   中图分类号:F830 文献标志码:A 文章编号:1673-291X(2010)26-0112-03      引言   从世界第一家信用卡公司产生至今,银行卡产业已有五十年的历史。经过五十多年的发展,围绕信用卡业务已经催生出一个规模庞大的产业,银行卡已经深深植根于当代经济和社会生活之中,成为现代金融业发展不可缺少的内涵。大力推进银行卡产业化发展,可以有效地挖掘产业内部蕴藏着的巨大商机,刺激消费需求,拉动经济增长,带动相关产业的发展。   而信用卡作为一种全新的支付手段和信用工具,已成为众多商业银行竞相推出的产品,信用卡的发卡数量急剧扩张。随之而来的问题是信用卡风险愈来愈高,因此,防范信用卡风险迫在眉睫。经营信用卡业务有高收益,同时伴随着高风险。如何有效防范和化解银行卡业务风险已成为各发卡机构共同探讨的问题。   近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,无数个数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为管理部门创造很多潜在的利润,而这种从海量数据库中挖掘信息的技术,就是数据挖掘。一个数据挖掘系统可以完成关联、分类、预测、聚类等数据挖掘任务。   本文以德国信用卡数据为例,使用关联规则挖掘的方法,试图探索消费者信用卡数据中的一些隐含的信息,寻找影响消费者信用卡违约的一些重要因素,总结出持卡人违约的一般性特??,从而可以为发卡行在甄别申请人的信息时提供一些建议和参考。   一、国内外研究现状及相关文献回顾   (一)信用卡欺诈   不良事件(adverse event)诸如失业、健康问题、医疗成本、离婚这些会减少债务人的收入以及增加他们的生活成本,是他们违约的一个较大的因素。Sullivan(2000)研究发现,失业导致的信用卡违约占67%;Himmelstein(2005)研究则发现,疾病、意外伤害以及医疗负担造成的信用卡违约占55%。与此相反,其他一些研究以面板数据来研究不良事件的影响得出了相反的结论。这些研究还认为不良事件的发生不是频繁的,因此不能作为信用卡违约的主要因素。在动态收入调查研究中发现,在信用卡滥用中,高负债所占的比例约为43%,而高负债则进一步导致了信用卡欺诈的发生。   (二)关联规则   关联规则挖掘可以发现传统的人工智能和统计方法所无法发现的规则或规律,因此其具有重要的研究价值。目前,世界上知名大学的研究机构和各大IT公司的研究部门都投入了大量精力对其进行研究,并取得了诸多的研究成果。美国斯坦福大学智能数据库系统实验室开发出了大量的商用化数据挖掘系统,如DBMiner挖掘系统。该系统包含了许多先进的挖掘算法,并有很多优秀的特点:用户无须具有高级的统计知识和培训即可使用该软件,因为底层的挖掘细节对于用户是不透明的;挖掘的知识类型多种多样,从关联规则、序列模式(Sequence Pattern)到发现驱动(Discovery-Driven)的分类等;并且,由于采用了许多先进的研究成果,因此该产品的速度声称是其同类竞争者的20倍;此外,该系统可以在多种平台上运行,并与许多主流的数据库系统(如SQL-Sever. Oracle等)结合紧密;同时,还引入了在线分析挖掘技术,使得系统更能充分发挥数据仓库的分析优势。IBM的Almaden实验室所进行的Quest项目同样也是数据挖掘研究领域中的佼佼者。该项研究包含了对关联规则、序列模式、分类及时间序列聚类(TimeSeries Clustering)的研究,其代表性的产品有:DB2 Intelligent Miner for Data。此外,美国的宾西法尼亚大学的数据挖掘研究小组也在这些方面取得了显著成果。其主要研究包括:利用注释和文本对数以百万计的文章进行聚类和分析;从多家医院的病人数据库中发现可以提高医疗质量和降低医疗费用的模式;在构建一个模型中选择合适的变量:基于DNA序列预测基因模式等。目前,世界上比较知名的数据库公司,如Oracle. Sy

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档