- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《金融数据挖掘案例分析》
课程设计报告
题 目:基于贝叶斯分类技术的贷款风险预测
学生姓名: 学 号:
系别班级:
专业(方向):
指导教师:
年 月日
基于贝叶斯分类技术的贷款风险预测
摘要
本文主要研究了朴素贝叶斯算法在贷款风险预测上对策应用。是一种基于最大后验概率的最优朴素贝叶斯在贷款风险的预测。思想是以训练集样本在不同朴素贝叶斯的后验概率作为反馈信息,从训练样本中选取部分最优样本,抛弃部分含有噪音的样本,作为最优的朴素贝叶斯算法。
关键词: 朴素贝叶斯 ;贷款风险;预测。
Abstract
This paper mainly studies the application of Countermeasures of naive Bayes algorithm in the loan risk prediction. Is a kind of forecast based on the maximum posterior probability optimal naive Bias on loan risk. Thought is the training set samples in different Bayesian posterior probability as the feedback information,select the part of the optimal sample from the training samples, discard somenoisy samples, as naive Bayes optimal.
Keywords: naive Bias; loan risk; prediction.
引言: 贷款风险通常是对贷款人而言的。从贷款人角度来考察,贷款风险是指贷款人在经营贷款业务过程中面临的各种损失发生的可能性。贷款风险是可以度量的,贷款风险具有可测性,可以通过综合考察一些因素,在贷款发放之前或之后,测算出贷款本息按期收回的概率。所谓贷款风险度就是指衡量贷款风险程度大小的尺度,贷款风险度是一个可以测算出来的具体的量化指标,它通常大于零小于1,贷款风险度越大,说明贷款本息按期收回的可能性越小,反之,贷款风险度越小,说明贷款本息按期收回的可能性越大。
1.朴素贝叶斯分类预测方法
贝叶斯分类算法是统计学的一种分类方法,它可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。通过分类算法的比较研究发现,一种称作朴素贝叶斯分类的简单贝叶斯分类算法可以与判定树和神经网络分类算法相媲美。用于大型数据库,贝叶斯分类也已表现出高准确率与高速度。朴素贝叶斯分类假定一个属于值对给丁磊的影响独立于其他属性的值。这一假定称作类条件独立。做此假定是为了简化所需计算,并在此意义下成为“朴素的”。
1.1贝叶斯定理
设X是类标号未知的数据样本。设为某种假定,如数据样本属于某特定的类。对于分类问题,我们希望确定—给定观测数据样本,假定成立的概率。是后验概率,或条件下的后验概率。例如,假定数据样本域由水果组成,用他们的颜色和形状描述。假定表示红色和圆的,表示假定是苹果,则反映当我们看到是红色并使圆的时,我们对是苹果的确信程度。作为对比,是先验概率,或得先验概率。对于以上的例子,它是任意给定的数据样本为苹果的概率,而不管数据样本看上去如何。后验概率比先验概率基于更多的信息(如背景知识)。是独立于的。
类似的,是条件下,的后验概率。即是说它是已知是苹果,是红色并且是圆的概率。是的先验概率。使用上面的例子,它是由水果集取出一个数据样本是红的和圆的的概率。贝叶斯定理就是提供了一中由,,和计算后验概率的方法。贝叶斯定理是:
(1)
1.2 朴素贝叶斯分类
朴素贝叶斯分类或简单贝叶斯分类的工作过程如下:
每个数据样本用一个维特征向量表示,分别描述对个属性样本的个度量。
假定有个类。给定一个未知的数据样本(即没有类标号),分类法将预测属于具有最高后验概率(条件下)的类。即是说,朴素贝叶斯分类将位置的样本分配给类,当且仅当
这样,最大化。其中最大的对应的类成为最大后验假定。根据贝叶斯定理(1)
(2)
由于对于所有类为常熟,只需要最大即可。如果类
文档评论(0)