- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
本文首先介绍了信用卡业务的基本知识,PCRM和数据挖掘的基本概念、原理和方法
本文描述了信用卡数据分类挖掘中的数据预处理过程,先从纷杂的应用数据中选择与分析主题有关的数据表,经过一系列数据库操作,从这些数据表中获得样本的输入信息,然后从交易历史信息中抽象出对样本分类的相关参数,将分类标准量化后得到对样本的分类。最后经过数据规格化、异常处理、缺失处理等数据清理方法对样本数据进行加工,得到分类挖掘所需的样本数据。本文的主要内容有:
对分类算法,详细介绍了SLIQ决策树算法和BP神经元网络分类算法,并提出了相应的信用评分模型和客户分析模型;
对聚类算法,介绍了CLIQUE算法及其实现,并建立了一个客户分析模型,即客户消费行为分析模型。
本文重点对异常检测算法作了较深入的学习,详细的分析了LOF算法的基本实现,以及在实现过程中的改进办法,并提出了客户异常消费行为分析模型。
基于UNIX和INFORMIX的 数据挖掘系统实现和挖掘结果。
展望,系统优化
引言
1-1信用卡知识
信用卡是集金融业务与电脑技术于一体的高科技产物,信用卡于1915年起源于美国,1952年,美国加利福尼亚州的富兰克林国民银行作为金融机构首先发行了银行信用卡。1959年,美国的美州银行在加利福尼亚州发行了美州银行卡。此后,许多银行加入了发卡银行的行列。到了六十年代,银行信用卡很快受到社会各界的普遍欢迎,并得到迅速发展指由商业银行向社会发行的具有消费信用、转账结算、存取现金等全部或部分功能的支付工具,不能透支。贷记卡是由银行或信用卡公司向资信良好的个人和机构签发的一种信用凭证,持卡人可在指定的特约商户购物或获得服务。信用卡既是发卡机构发放循环信贷和提供相关服务的凭证,也是持卡人信誉的标志,可以透支。按照授信程度的不同,贷记卡分为真正意义上的贷记卡和准贷记卡。贷记卡是指发卡银行给予持卡人一定的信用额度,持卡人可在信用额度内先消费、后还款的信用卡。准贷记卡是指持卡人须先按发卡银行要求交存一定金额的备用金,当备用金账户余额不足支付时,可在发卡银行规定的信用额度内透支的信用卡。
从2003年国内信用卡起步至今,每年的发卡量均增长80%以上。央行的统计显示,截至2007年底,含贷记卡和准贷记卡在内,全国累计发卡量已超过8750万张,国内商业银行要在当前阶段扩大发卡规模和提高服务质量之间找到完美结合点,上述麦肯锡的报告指出,中国消费者信用卡的总体渗透率依然较低,在14%左右。在上海等一级城市的富裕阶层中有超过1/3的人目前都拥有信用卡,并开始熟悉信用卡的使用。相比之下,在台湾和香港地区各收入群体中分别有70%和81%的家庭持有信用卡。可资对比的还有,在国外,信用卡业务是银行盈利的重要来源之一。比如,信用卡业务作为花旗银行的拳头产品,该业务一年的收益就占了花旗纯利润的1/3。虽然,目前国内只有招行等为数不多的商业银行在信用卡领域实现盈利,然而盈利的预期却是相当诱人。 麦肯锡的报告预测,到2013年中国信用卡行业的整体利润将达到130亿元人民币。报告称,中国信用卡市场依然是中国个人金融服务市场中成长最快的产品线之一。
1-2数据挖掘技术和应用
数据挖掘,也叫数据库中的知识发现 KDD(Knowledge Discovery in Database),KDD 一词最早是出现在1989 年8 月的第11 届国际联合人工智能学 术会议上。
数据挖掘的广义定义为:数据库中的知识发现,即从大规模的数据中抽取非 平凡的、隐含的、未知的、有潜在使用价值的信息的过程[FPS96]。狭义的理解 认为数据挖掘只是KDD 的一个步骤。KDD 的整个过程包括数据选取、数据预处理 和数据清洗、数据挖掘、知识评估等多个步骤,而数据挖掘只是其中对经过预处 理的数据进行处理,抽取知识的一个过程。
当前,在各种企业、商业领域、科学研究领域所收集的数据,数据规模都越 来越庞大,甚至G、T 级的数据规模,面对如此庞大的数据,利用传统的数据分 析手段已经无法有效的理解和使用这些数据,由此导致越来越严重的“数据爆炸 而知识贫乏”。另外,传统的数据分析方法,例如统计方法,只能获得数据的表 面信息,而不能获得数据的内在联系以及潜在的规律。这需要新的技术来智能的 有效的分析这些数据,以使数据得以充分利用。这就是数据挖掘(Data Mining) 技术产生的背景。 数据挖掘是目前国际上数据库和信息决策领域的最前沿研究方向之一,引起 了学术界和工业界的广泛关注。国际上许多研究机构都在这个领域开展了各种各
样的研究计划。研究的主要目标是发展有关的方法论、理论和工具,以支持从大 量数据中提取有用的、让人感兴趣的知识和模式。数据挖掘是面向应用的多学科 交叉领域,应用推动了数据挖掘技术和理论的研究
您可能关注的文档
- 《我国信用卡市场的风险问题及其防范对策》-毕业论文(设计).doc
- 《我国上市公司资本结构优化问题研究》-毕业论文(设计).doc
- 《我国中小会计师事务所的发展中存在的问题与对策》-毕业论文(设计).doc
- 《我国中小企业发展电子商务策略》-毕业论文(设计).doc
- 《卧式带锯床液压系统的改进和升级》-毕业论文(设计).doc
- 《屋面防水技术的应用与实效做法研究》-毕业论文(设计).doc
- 《无机离子浓度对以木糖为碳源的产氢发酵的影响》-毕业论文(设计).doc
- 《无线传感器网络路由协议设计》-毕业论文(设计).doc
- 《无线多点湿度监控仪的设计(下位机)》-毕业论文(设计).doc
- 《无线全数字温湿度火焰监控系统》-毕业论文(设计).doc
文档评论(0)