- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于不同模型对德国信贷评价的预测分析.doc
基于不同模型对德国信贷评价的预测分析
摘要:本文主要运用数据挖掘所学的各种模型对德国信贷评价数据集做了具体的分析,首先通过分析数据各变量之间的关系,运用R软件,然后用主成分分析,回归分析,BP神经网络,支持向量机对数据进行预测,最后比较不同预测模型的准确性,通过几种模型的对比可看出各种模型预测的好坏。
关键词:主成分分析 回归分析 BP神经网络 支持向量机
一、数据分析
(一)主成份分析
主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
前19个成分的累计贡献率已经达到90%,另外其他的主成分可以舍去,达到降维的目的,观察各成份的比例,会发现成份增加时,所占比例没有明显增加,各成份没有明显的主次之分。下面是碎石图:
图像下降得较为平滑,没有明显的“陡峭”。
同时也考虑了一下,相关系数矩阵进行分析,得到图如下:
从以上分析,大致可知各变量所占比重较平均,没有特别地偏重哪个变量。
(二)回归分析
多元回归分析:表现在线性回归模型中的解释变量有多个。一
般表现形式:
对训练集进行多元回归分析,并用测试集进行检测,得到的准确率是0.742。
(三)逐步回归分析
上面的多元回归分析中涉及变量较多,为了简化模型,进行逐步回归分析,选取其中十一个变量。
得到结果如下:
对训练集进行逐步回归分析,并用测试集进行检测,得到的准确率是逐步回归分析的准确率为0.753。
1、BP神经网络
算法。令1:good 2:bad先对数据进行处理,调用r.studio 中的AMORE包。
每一百次输出一次,共显示10次:
index.show: 1 LMS 0.672420016008633
index.show: 2 LMS 0.682084907905352
index.show: 3 LMS 0.699954664285038
index.show: 4 LMS 0.700077412246174
index.show: 5 LMS 0.700084847039235
index.show: 6 LMS 0.700079842363825
index.show: 7 LMS 0.700037627521291
index.show: 8 LMS 0.685135487222039
index.show: 9 LMS 0.682417548537964
index.show: 10 LMS 0.679170941744628
从结果可以看出准确率在0.68左右。
2、支持向量机
支持向量机(SVM)是一种线性和非线性数据的分类方法,它使用非线性映射将原始数据映射到高维空间,在该空间内搜索最佳分离超平面。
Parameters:
SVM-Type: eps-regression
SVM-Kernel: radial
cost: 1
gamma: 0
epsilon: 0.1
Number of Support Vectors: 414
得到的准确率是0.752。
二、结论以及建议
在主成份分析中,对每个变量间的关系进行了分析,发现25个变量的选取很好,彼此间相关性比较小,也从侧面证明了,评价机构选取的评测依据是有代表性的。
用了四种方法对德国信贷评价进行了训练预测,结果准确率由高到低为:逐步回归的准确率0.753、支持向量机的准确率0,752、多元线性回归的准确率0.742、BP神经网络的准确率0.68。
如果希望尽量用少的变量对数据结果进行预测的话,可以做回归分析,选取更具代表性的特征进行分析。
参考文献:
[1]郭娟,基于BP神经网络的中国铁矿石需求量预测[J].国土资源情报,2009.1
[2]王磊,基于主成分分析的支持向量机回归预测模型[J].信息技术,2008.12
[3]薛毅,陈立萍,R统计建模与R软件[M].清华大学出版社,2009
[4]梁文光,广东省GDP时间序列预测-基于神经网络与ARIMA模型[J].技术与市场,2010
您可能关注的文档
- 地方政府助力小微企业众筹融资扶持性政策的路径研究.doc
- 地方政府引进高层次创业创新人才的机制措施研究.doc
- 地方政府投融资平台的“精益”转型.doc
- 地方政府支出及FDI与地方经济增长之间的关系.doc
- 地方政府财政教育投入管理问题研究.doc
- 地方智库管理体制和机制创新研究.doc
- 地方本科高校实践课教学队伍建设研究.doc
- 地方网贷监管的考量维度.doc
- 地方股权市场发展定位问题研究.doc
- 地方财政监督的难点及对策.doc
- 中国行业标准 DB/T 100-2024区域性地震安全性评价.pdf
- 《GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架》.pdf
- GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- DB/T 100-2024区域性地震安全性评价.pdf
- 中国行业标准 GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- 校园周边书店阅读氛围对初中生阅读素养提升的影响研究教学研究课题报告.docx
- 初中校园餐饮卫生监管与食品安全教育创新模式研究教学研究课题报告.docx
- 《文化遗产保护与旅游开发平衡机制的法律法规完善研究》教学研究课题报告.docx
- 《农作物病虫害生物防治技术的经济效益与社会影响分析》教学研究课题报告.docx
- 1 剖宫产术后子宫瘢痕憩室治疗中的并发症预防与护理措施教学研究课题报告.docx
最近下载
- 药事管理学药品注册管理课件.ppt VIP
- 《肩袖损伤与肩周炎》课件.ppt VIP
- 2024年重庆市巴蜀中学初升高自主招生语文试卷真题(含答案).docx VIP
- 中介新房培训课件内容.ppt VIP
- 2024年重庆渝中区重庆市巴蜀中学自主招生数学试卷(初升高保送)(详解版).pdf VIP
- 2025年西藏自治区公务员录用考试面试真题试卷(结构化小组)题型分析.docx VIP
- 药品注册管理课件.ppt VIP
- 击剑基础理论知识单选题100道及答案解析.docx VIP
- 《未成年人保护法》课件ppt.pptx VIP
- (高清版)B-T 19363.1-2022 翻译服务 第1部分:笔译服务要求.pdf VIP
文档评论(0)