- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
贝叶斯网络在用户信用评估中应用研究
贝叶斯网络在用户信用评估中应用研究
摘 要:为了弥补传统朴素贝叶斯分类器在实际应用中代价不敏感的缺点,基于最小风险准则构建朴素贝叶斯模型和树增强朴素贝叶斯网模型,通过预先设置损失矩阵,分类器可以区分各种误判情形产生的代价,利用1 000条德国信用卡样本数据进行实验。研究发现,在以损失最小为导向的用户信用评估方面,基于最小风险准则构建分类器产生的总损失更小,综合性能更好;在分类性能上,简单的朴素贝叶斯模型可与复杂的基于爬山算法建立的贝叶斯网络模型相媲美;从整体经济效益看,朴素贝叶斯模型更胜一筹。
关键词:朴素贝叶斯;树增强朴素贝叶斯网;代价敏感;最小风险准则;爬山算法
DOI:10.11907/rjdk.171519
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2018)006-0146-04
Abstract:In order to make up for the shortcoming that the traditional Naive Bayes is not sensitive in the practical application, Naive Bayes and Tree augmented naive Bayesian network are established based on the minimum risk criterion. By pre-setting the loss matrix, the classifier can distinguish the costs of various miscarriages.1 000 German credit card samples were used for experiments. Experiment results have shown that the classifier based on the minimum risk criterion produces less total loss and better overall performance in the least-cost-oriented user credit evaluation. In terms of classification performance, the simple Naive Bayesian model can be compared with the complex Bayesian network model based on the hill-climbing algorithm. The Naive Bayes model is superior in the overall economic efficiency.
Key Words:Naive Bayes; tree augmented naive bayesian network; cost sensitive; minimum risk criterion; hill climbing algorithm
0 引言
?叶斯网络是贝叶斯方法与图形理论的有机结合[1]。1986年Pearl首次在专家系统中引进了贝叶斯网络[2]。贝叶斯网由于在理论上具有严格性和一致性,能直观表达图形化知识等特点,已经成为人工智能领域的研究热点。贝叶斯网的学习包括构建有向无环图的学习、结构学习及每个变量局部条件概率分布的学习即参数学习。贝叶斯网本身是一种不定性因果关联模型,具有强大的不确定性推理能力,利用条件概率表示各变量间的相关性。朴素贝叶斯分类器基于一个简单的假设:在给定分类特征条件下属性值之间条件是相互独立的。在现实世界中,它的属性独立性假设使其无法表示实际应用中各属性之间的依赖关系,影响了分类性能。因此,针对实际应用对朴素贝叶斯分类模型进行改进,使之在属性独立性假设不满足的条件下依然具有较高分类精度。由于“朴素贝叶斯假设”在实际中往往不成立,因此对朴素贝叶斯分类器的改进,一般从放松朴素贝叶斯假设入手,当属性间存在依赖时,采用合适的方法对分类器结构进行修正。隐藏朴素贝叶斯[3]考虑属性间的依赖关系,并采用条件互信息进行计算。树增强朴素贝叶斯(Tree Augmented Naive Bayesian Classifier, TAN分类器)假设在贝叶斯网中,每个属性除了有类别属性作为父节点外,还可以有至多一个其它属性作为父节点,所有属性节点可以构成一个最大支撑树。TAN模型通过发现属性对之间的依赖关系放松朴素贝叶斯中任意属性之间独立的假设[4]。贝叶斯网的结构学习一般需要考虑模型选择和模型优化两个方面[5]。模型选择决定
原创力文档


文档评论(0)