建立信用评分模型利用遗传编程-Read.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
创新研修作业陆原鹏建立信用评分模型利用遗传编程周崇雄黄纪正郑国雄信息管理系国立台湾大学台北台湾管理技术学院国立交通大学路新竹年台湾管理学院海南大学桃园县摘要信用评分模型已被广泛研究领域的统计机器学习和人工智能许多新方法如人工神经网络神经网络粗集或决策树已建议增加信贷的准确性得分模型由于改善准确性不到百分之一可能转化为重大的节约更先进的模型应提议大大提高精度的信用评分的模式本文遗传编程是用来建立信用评分模型两个数值例子将聘用这里的错误率比较其他信用评分模型包括人工神经网络决策树粗糙集和回归在此基础

创新研修作业 陆原鹏 建立信用评分模型利用遗传编程 周崇雄,黄纪正,郑国雄, 信息管理系,国立台湾大学,台北,台湾 管理技术学院,国立交通大学,Ta-Hsuch路, Hsunchu 300 ,新竹1001年,台湾 管理学院,海南大学,桃园县 摘要 信用评分模型已被广泛研究领域的统计,机器学习,和人工智能( AI ) 。许多新方法,如人工神经网络(神经网络) ,粗集,或决策树已建议增加信贷的准确性得分模型。由于改善准确性不到百分之一可能转化为重大的节约,更先进的模型应提议大大提高精度的信用评分的模式。本文遗传编程(GP)是用来建立信用评分模型。两个数值例子将聘用这里的错误率比较其他信用评分模型包括人工神经网络,决策树,粗糙集和Logistic回归。在此基础上的结果,我们可以得出结论GP可以提供更好的性能优于其它型号的模型。 2005年埃尔塞维尔有限公司All rights reserved 。 关键词:信用评分;人工神经网络( ANN ) ;决策树;遗传规划(GP) ;粗糙集 1 导言 信用评分模型已广泛应用于金融机构,以确定是否属于贷款客户是良好的申请人集团还是坏的申请人集团。利用信用评分模型的优势可以被描述为从降低信贷成本的分析造福,从而实现更快的信贷决定,确保信贷集合,并尽可能减少风险(李,邱,吕陈, 2002年;西, 2000年) 。由于改善准确性不到百分之一可能转化为可观的节余(西, 2000年) ,更先进的模型应该提议大大提高精度的信用评分模型在本文。 为了获得满意的信用评分模型,许多方法被提出。大体上,这些 方法可分为以参数统计方法(例如,判别分析和logistic回归) ,非参数统计方法(例如K近邻和决策树)和软计算方法(如人工神经网络( ANN )和粗糙集) 。近年来,人工神经网络是用于信用评分最流行的工具,并已有报告说,其精确度优于传统的统计方法处理关于信用评分的问题,特别是在关于非线性模式(德赛克鲁克, & Overstreet , 1996年, 1997年;Mahlhotra &马罗特拉, 2003年;詹森, 1992年; Piramuthu ,1999年) 。然而,另一方面,人工神经网络已被批评其表现不佳纳入不相关的属性或小的数据集(卡斯蒂略,马绍尔群岛,格林科登, 2003年;费罗& Cleror , 2002年;纳特,Rajagopalan , & Ryker , 1997年) 。 为了建立一个有效的判别函数,两个问题应该加以考虑。首先,之间的关系属性和类别可线性或非线性。第二,不相关的属性,应该被取消,以便提高精度的分类模型。在本文,GP是采用自动和启发式以确定适当的判别函数和有效属性同时进行。此外,与人工神经网络不同的只适合于大型数据集,GP在小数据集可以做得更好(纳特等人 , 1997年) 。 为了有效地获取判别功能,数据集进行预处理的离散。两个现实世界案件将用于以下比较准确率其他分类模式包括logistic回归模型,人工神经网络,决策树和粗糙集。在此基础上,我们可以得出结论,可以提供更好的性能优于其它型号的模型。 其余本文安排如下。第2节介绍了模型的信用评分。离散和遗传规划中提出了第3节。两个实时世界的例子是用来证明拟议,方法在第4节。讨论中提出的第5节和结论是在第6节。 2 信用评分模型 在本节中,我们描述三种流行中使用的模式建立信用评分模型。第一种模式是后勤回归,这是主要用于在统计领域分类问题。第二种模式是人工神经网络,这是以其出色的学习能力,非线性关系的一种制度。第三个模型是粗糙集,这是一种感应基础算法,并已被广泛应用在20世纪90年代以来的分类问题。 2.1 。 Logistic回归 Logistic回归模型是一个最流行的统计工具的分类问题. Logistic回归模型,不同于其他统计工具(例如判别分析或普通线性回归) ,可以适合各种分配的职能,如Gamble,Poisson, normal等(新闻威尔逊, 1978年)更适合信用评分的问题。另外,为了提高其准确性和灵活性的几种方法已建议延长传统二进制后勤回归模型,其中包括多分类Logistic回归模型(莱斯蒂, 1990年;奥尔德里奇和纳尔逊, 1984年; DeMaris ,1992年;诺克&伯克, 1980年;廖, 1994年)和后勤回归模型下令类别(本周二, 1980年) 。因此,广义Logistic回归模型是一般形式的二元逻辑回归模型和多分类Logistic回归模型。 让一个P -三维解释变量x0Z(x1,x2,., xp)和Y的反应变量与类别1,2,.,r. 那么多分类Logistic回归模型得到的 方程 (1) 是一个(p+1)条载体的回

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档