基于决策树方法银行客户关系管理研究和应用.docVIP

基于决策树方法银行客户关系管理研究和应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于决策树方法银行客户关系管理研究和应用

基于决策树方法银行客户关系管理研究和应用   摘要:数据挖掘中的决策树算法在银行业中有很重要的价值。决策树技术应用于银行业中,可以通过对特定的客户背景信息的分析,预测该客户所属的客户类别,从而采取相应的经营策略,这样既可以提高银行服务的服务水平,开发客户资源,避免客户流失,又能够节约资源,利用最小的投入,获得较大的收益。在银行贷款业务中,判断贷款对象是否有风险,贷款方案是否可行,将客户按照银行的实际需求进行分类,这些问题通过决策树算法都可以解决。   关键词:决策树算法;客服背景信息;数据挖掘   中图分类号:TP315 文献标识码:A DOI:10.3969/j.issn.1003-6970.2012.07.026   引言   决策树算法已经被成功的应用于很多分类问题,并尝试采用其中的ID3算法来完成银行客户数据的贷款风险预测。根据模拟的银行客户基本资料的数据,通过建立决策树模型,对客户群体的贷款风险进行预测,找出分类规则。具体实现过程中,详细描述了实验数据预处理的方法和步骤、数据库模块、决策树生成模块、以及验证和预测模块。其中,针对ID3算法要求属性离散化这一特点,将连续属性进行区间划分,并对数据进行预处理,使数据能够满足算法的要求。针对在算法实现过程中所遇到的识别性问题提出了一种属性标识方法。在此基础上,结合商业银行的特征,建立了一个银行贷款风险预测模型,对模型进行验证,并从该模型产生出相应的规则。该模型可应用于银行客户关系管理中客户贷款风险的控制。最后利用规则得出的结论结合客户的实际信息来实现对客户贷款风险的预测。   1.决策树   决策树技术由于其生成的规则容易理解和可解释性等特点,被广泛地应用于数据挖掘领域。决策树由三个基本部分组成:节点、分支和树叶节点。决策树中的节点是一个测试条件,这个测试条件将决策树分为多个分支,每个分支代表了该误1试条件的每个可能答案,位于决策树最顶端的节点为根节点。每个分支会连接另一个节点,或者连接决策树的末端(即树叶节点),决策树建立起来后,需要预测的数据对象从根节点出发,根据所经过的节点的测试条件选择要经过的分支,并最终到达树叶节点。树叶节点的值或类别也就是要赋予该数据对象的值或类别。   2.ID3算法   ID3算法的核心是在决策树上各层节点上选择属性时通过计算信息增益来选择属性,使得在每一个非叶节点进行测试的时候,能获得关于测试记录的最大类别信息。具体的方法就是:检测所有的属性,选择信息增益最大的属性产生决策树的节点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树节点的分支,直到所有的子集仅包含同一类别的数据为止。最后得到一棵决策树,它可以用来对新的数据集进行分类。   ID3算法的具体描述如下:   输入:训练数据集samples,候选属性的集合attributes_list   输出:一棵决策树   算法:   (1)创建节点N   (2)如果samples都在同一个类C中   (3)那么返回N作为叶节点,以类C标记;   (4)如果attributes_list为空   (5)那么返回N作为叶节点,标记为samples中最普通的类;//多数表决   (6)选择attributes_list中具有最高信息增益的属性test_sttributes   (7)标记节点N为test_sttributeS;   (8)对于每一个test_sttributes中的已知值A;//划分samples   (9)有节点N长出一个条件为test_sttributes=A的分枝;   3.决策树技术在银行CRM中的实证研究   (一)数据挖掘任务的提出。在传统存贷款业务中主要包括三类,即个人、单位和同业存款。其中个人储蓄主要形式是活期和定期等形式,在个人存款客户关系管理中,由于客户分散,数量较多,利用决策树技术对客户进行分类,并找出各类客户的特征,使其有目标、针对性地开展客户营销活动,降低客户营销成本,提高银行新的利润增长点。   (二)用于数据挖掘的数据分析。在客户关系管理的数据挖掘系统中,并不是所有的数据格式都能直接被用于数据挖掘,一般用于数据挖掘的数据有以下特点:一是所有的数据应该放在单一的表格中;二是每行应该与一个实体相对应,例如客户;三是带有单一数值的列应该被忽略;四是对每列带有不同数值的列应该被忽略;五是对于预言性建模,目标列应该被识别,并且所有的同义列要除去。因此,必须对数据进行预处理。   4.实验中间数据和结果   决策树的生成过程采用从上到下的策略。随着迭代深度的增加,算法考虑的数据集数将不断减少,使得在较深层次的数据集划分中,专注于训练数据集的某个子集的统计信息,而忽视各类数据集的整体分布情况,造成对噪声的敏感。所以,虽然一棵完整的决策树能够非

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档