- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2008年暑假第一次竞赛论文--历年数学建模优秀论文大全推荐
数学建模论文
姓名
学院
年级
专业
学号
联系电话
相关学科成绩
高等数学
线性代数
概率统计
数学模型
数学实验
英语四级
英语六级
范兴容
自动化
06级 自动化
2006492083
85
87
94
张 伟
自动化
06级 自动化
2006477862
65
62
75
530
刘 圆
软件工程
06级 软件工程
2006540491
92
90
499
小组成员介绍:
银行贷款发放信用评价问题
摘要
本文针对商业银行在发放贷款的过程中,如何利用一定的判别准则对申请贷款企业信用度进行打分的问题,建立相应的数学模型,给出判别准则。
首先,对商业银行现有的600个申请贷款企业背景资料及打分情况的数据进行预处理。巧妙地构建字符型取值数值化公式,合理的将离散型变量(取值均为字符型)取值数值化,以及利用spss软件对15个自变量和1个因变量做相关性分析,筛选出12个属性变量。此外,通过回归分析对数据进行深挖掘,利用MATLAB软件对背景资料数据作时序残差图,考察分析时序残差图发现有64个奇异点,在Logistic回归模型中将对应的64个样本点予以剔除。
然后,对预处理所得的背景资料数据,建立Logistic回归模型,利用spss统计软件对模型求解,得到各属性的权重系数。以谋求判别结果与原始结果吻合度最大为原则,给出了判别准则。
随后,鉴于背景资料信息不全的情况,本文利用算子的思想,构建“缺省信息均值”,同时定义相应的“缺省信息运算法则”,对Logistic回归模型进行修正。利用C++软件编程,重新求得修正后的各属性权重系数。本文特从600个申请贷款企业随机抽取75个样本,随机丢失若干属性信息,同样以谋求判别结果与原始结果吻合度最大为原则,给出修正后的判别准则。
接下来,通过C++编程,利用给出的判别准则对剔除64个问题样本点后的536个企业重新打分,结果与原始打分相比,吻合度达到98.5%。对被剔除的64个企业单独重新打分,发现与原始结果完全相反,实际是对问题样本点进行了纠正,打分准确度达到100%。同样使用判别准则求得前53个待申请企业打分值。分析修正判别准则对随机抽取75个样本打分结果,发现对不发放贷款的企业的原始打分与重新打分完全相同,实现了风险最小化原则,再使用修正判别准则求得后37个待申请企业打分值。
最后,我们就模型存在的不足之处提出了改进方案,并对优缺点进行了分析,根据数据分析结果,为银行高层管理者写一份报告,使判别准则得以被采用。
关键字 信用评价 Logistic回归模型 判别准则 缺省信息运算法则
一、问题的提出
商业银行计划给有需求的企业发放贷款时,为了有效地减少金融风险,要求每个申请贷款企业提供企业经营状况的相关资料,并根据这些资料,对这些企业进行打分,以确定是否为其提供贷款。
考虑以某银行现有600个申请贷款企业的背景资料及打分情况,为保护商业秘密,资料中的属性(变量)已换成没有任何意义的代码。如
b,30.83,0,u,g,w,v,1.25,t,t,01,f,g,00202,0,+
a,38.58,5,u,g,cc,v,13.5,t,f,0,t,g,00980,0,-
资料中共有15个属性(用逗号隔开,分别记为A1——A15)和一个打分情况, 要求给出一种判别准则,并对这600个企业重新打分,使打分与原打分尽可能相吻合。
现有90个待申请贷款企业,企业背景资料与前600个申请贷款企业有相同的形式,现应用所给出的判别准则对这90个申请贷款企业中的前53名进行打分,以确定是否为其提供贷款。
由于企业自身的原因(如漏填或有意不填),有些项的指标没有填写(没有填写的项在表中为?),针对这种情况,修正判别准则,然后对90个申请贷款企业中的后37名行打分,以确定是否为其提供贷款。
最后,为银行的高层管理者写一份报告,阐述判别方法的正确性或合理性,使其被采用。
二、问题的分析
本题背景资料中属性变量的类型有两种:连续型和离散型,且离散型变量的取值均为字符型,无法用函数关系来刻画属性和因变量之间的关系。因此,它们无法直接为数学模型所用。此外,资料中的离散型变量已换成没有任何意义的代码,无法观察各属性变量间的关系以及对判别结果的影响。同时考虑各个申请贷款企业经营状况的相关资料是由各个企业向银行提供的,其属性变量的取值必然存在人为误差。基于上述三个原因,本文必须对已知数据进行预处理。鉴于90个待申请贷款企业中的后37名的背景资料不齐全,我们必须对判别准则进行修正,最后通过修正判别准则进行打分。我们需要解决下列关键分析:
数据的处理。包括离散变量取值数值化,利用相关性分析对属性变量进行筛选以及通过回归分析背景资料进行筛选。
您可能关注的文档
- 2006级职业中专计算机及应用专业实施性教学计划推荐.doc
- 2007--2008学年度第二学期清华附中高二期末考试试卷语文推荐.doc
- 2007-2008学年度第二学期德育工作计划推荐.doc
- 2007-2008学年度(上期)学术讲座完成情况统计表推荐.doc
- 2007—2008学年度第一学期德育工作计划推荐.doc
- 2007专利代理人考试专利法真题推荐.doc
- 2007九四中学八年级(下)古诗词、名著试题推荐.doc
- 2007产品质量检验培训ppt推荐.doc
- 2007-2008学年群鲜em长沙市一中第二学期高一期中考试推荐.doc
- 2006~2007学年第二学期罗定第一中学九年级化学第二次模拟测试题推荐.doc
文档评论(0)