- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
创新研修作业陆原鹏建立信用评分模型利用遗传编程周崇雄黄纪正郑国雄信息管理系国立台湾大学台北台湾管理技术学院国立交通大学路新竹年台湾管理学院海南大学桃园县摘要信用评分模型已被广泛研究领域的统计机器学习和人工智能许多新方法如人工神经网络神经网络粗集或决策树已建议增加信贷的准确性得分模型由于改善准确性不到百分之一可能转化为重大的节约更先进的模型应提议大大提高精度的信用评分的模式本文遗传编程是用来建立信用评分模型两个数值例子将聘用这里的错误率比较其他信用评分模型包括人工神经网络决策树粗糙集和回归在此基础
创新研修作业
陆原鹏
建立信用评分模型利用遗传编程
周崇雄,黄纪正,郑国雄,
信息管理系,国立台湾大学,台北,台湾
管理技术学院,国立交通大学,Ta-Hsuch路, Hsunchu 300 ,新竹1001年,台湾
管理学院,海南大学,桃园县
摘要
信用评分模型已被广泛研究领域的统计,机器学习,和人工智能( AI ) 。许多新方法,如人工神经网络(神经网络) ,粗集,或决策树已建议增加信贷的准确性得分模型。由于改善准确性不到百分之一可能转化为重大的节约,更先进的模型应提议大大提高精度的信用评分的模式。本文遗传编程(GP)是用来建立信用评分模型。两个数值例子将聘用这里的错误率比较其他信用评分模型包括人工神经网络,决策树,粗糙集和Logistic回归。在此基础上的结果,我们可以得出结论GP可以提供更好的性能优于其它型号的模型。
2005年埃尔塞维尔有限公司All rights reserved 。
关键词:信用评分;人工神经网络( ANN ) ;决策树;遗传规划(GP) ;粗糙集
1 导言
信用评分模型已广泛应用于金融机构,以确定是否属于贷款客户是良好的申请人集团还是坏的申请人集团。利用信用评分模型的优势可以被描述为从降低信贷成本的分析造福,从而实现更快的信贷决定,确保信贷集合,并尽可能减少风险(李,邱,吕陈, 2002年;西, 2000年) 。由于改善准确性不到百分之一可能转化为可观的节余(西, 2000年) ,更先进的模型应该提议大大提高精度的信用评分模型在本文。
为了获得满意的信用评分模型,许多方法被提出。大体上,这些
方法可分为以参数统计方法(例如,判别分析和logistic回归) ,非参数统计方法(例如K近邻和决策树)和软计算方法(如人工神经网络( ANN )和粗糙集) 。近年来,人工神经网络是用于信用评分最流行的工具,并已有报告说,其精确度优于传统的统计方法处理关于信用评分的问题,特别是在关于非线性模式(德赛克鲁克, & Overstreet , 1996年, 1997年;Mahlhotra &马罗特拉, 2003年;詹森, 1992年; Piramuthu ,1999年) 。然而,另一方面,人工神经网络已被批评其表现不佳纳入不相关的属性或小的数据集(卡斯蒂略,马绍尔群岛,格林科登, 2003年;费罗& Cleror , 2002年;纳特,Rajagopalan , & Ryker , 1997年) 。
为了建立一个有效的判别函数,两个问题应该加以考虑。首先,之间的关系属性和类别可线性或非线性。第二,不相关的属性,应该被取消,以便提高精度的分类模型。在本文,GP是采用自动和启发式以确定适当的判别函数和有效属性同时进行。此外,与人工神经网络不同的只适合于大型数据集,GP在小数据集可以做得更好(纳特等人 , 1997年) 。
为了有效地获取判别功能,数据集进行预处理的离散。两个现实世界案件将用于以下比较准确率其他分类模式包括logistic回归模型,人工神经网络,决策树和粗糙集。在此基础上,我们可以得出结论,可以提供更好的性能优于其它型号的模型。
其余本文安排如下。第2节介绍了模型的信用评分。离散和遗传规划中提出了第3节。两个实时世界的例子是用来证明拟议,方法在第4节。讨论中提出的第5节和结论是在第6节。
2 信用评分模型
在本节中,我们描述三种流行中使用的模式建立信用评分模型。第一种模式是后勤回归,这是主要用于在统计领域分类问题。第二种模式是人工神经网络,这是以其出色的学习能力,非线性关系的一种制度。第三个模型是粗糙集,这是一种感应基础算法,并已被广泛应用在20世纪90年代以来的分类问题。
2.1 。 Logistic回归
Logistic回归模型是一个最流行的统计工具的分类问题. Logistic回归模型,不同于其他统计工具(例如判别分析或普通线性回归) ,可以适合各种分配的职能,如Gamble,Poisson, normal等(新闻威尔逊, 1978年)更适合信用评分的问题。另外,为了提高其准确性和灵活性的几种方法已建议延长传统二进制后勤回归模型,其中包括多分类Logistic回归模型(莱斯蒂, 1990年;奥尔德里奇和纳尔逊, 1984年; DeMaris ,1992年;诺克&伯克, 1980年;廖, 1994年)和后勤回归模型下令类别(本周二, 1980年) 。因此,广义Logistic回归模型是一般形式的二元逻辑回归模型和多分类Logistic回归模型。
让一个P -三维解释变量x0Z(x1,x2,.,
xp)和Y的反应变量与类别1,2,.,r.
那么多分类Logistic回归模型得到的
方程
(1)
是一个(p+1)条载体的回
您可能关注的文档
- 宁波第七届学术大会分会场摄制及研讨内容指南.doc
- 安徽铜矿地质勘查专项规划.doc
- 安泰与赫拉克勒斯-三河第二中学.ppt
- 室搬运与废弃物清运流程.ppt
- 宫缩应激试验胎儿生物物理评分.ppt
- 家畜解剖基础2009-2010学第一学期-天津广播电视大学.doc
- 密固达治疗激素继发骨质疏松症.pdf
- 对于损伤严重的情况应采用碳纤维复合芯特制补修管进-adss光缆.doc
- 寿险业负面评等因子资产负债管理失衡-TaiwanRatings.ppt
- 小一分离焦虑-新上国小.doc
- 无纺布制医用消毒盖布项目可行性实施报告.docx
- 中国光纤预警系统行业市场现状及未来发展趋势研究报告.pdf
- 质量管理常用术语中英文对照.docx
- 2024年06月内蒙古呼伦贝尔文旅广局所属事业单位多元化岗位公开招聘9名工作人员笔试历年典型考题及全考点剖析附答案解析.doc
- 2024年06月广东揭阳市惠来县招商引资服务中心公开招聘事业单位工作人员6人笔试历年典型考题及全考点剖析附答案解析.doc
- 食品企业质量管理量化考核细则.docx
- 市场监管食品执法知识解析.docx
- 常用(全)化工产品英文缩写表.docx
- 2020-2021学年七年级上册地理期末模拟试卷及答案人教版.doc
- 2020-2021学年七年级上册地理期末试卷及答案A卷人教版.doc
最近下载
- GB_T21114-2019耐火材料 X射线荧光光谱化学分析熔铸玻璃片法.docx VIP
- 《翻译研究入门理论与应用》总结笔记教学内容.pdf VIP
- 生物柴油-乙醇-水三元体系及其乳化试验研究.pdf
- 2024年苏州市相城区应急管理局公开招聘公益性岗位工作人员1人笔试备考试题及答案解析.docx VIP
- 客户客户来访接待流程(含流程和表单-附《客户来访接待申请单》表单).docx
- 2024年湖北省中考地理生物试卷(含答案).pdf
- 机械格栅说明书细格栅-2022.docx VIP
- 机械制图(五)形位公差.ppt
- 数学与魔术(刘婷).ppt
- 日立mca电梯CA13简洁版图纸电气原理图纸K3500602.pdf
文档评论(0)