Bayes评分与BIC评分对简单Bayes网络结构学习结果复杂度影响.docVIP

Bayes评分与BIC评分对简单Bayes网络结构学习结果复杂度影响.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Bayes评分与BIC评分对简单Bayes网络结构学习结果复杂度影响

Bayes评分与BIC评分对简单Bayes网络结构学习结果复杂度影响   摘要:在基于评分-搜索的Bayes网络结构学习算法中,评分函数的选取对学习的结果具有关键影响。文章利用随机给定的观测数据,采用Bayes评分函数和BIC评分函数,对一些节点数较少的Bayes网络进行穷举式结构学习,并对学习结果的复杂度进行了测算和分析。仿真实验表明,在相同的观测样本下,采用BIC评分函数将得到比采用Bayes评分函数更简单的Bayes网络。   关键词:Bayes网络;网络结构;学习结果;复杂度;Bayes评分;BIC评分 文献标识码:A   中图分类号:TP181 文章编号:1009-2374(2016)18-0188-02 DOI:10.13535/j.cnki.11-4406/n.2016.18.094   Bayes网络可以用有向图的形式形象地表示出考虑的对象间的概率依存关系。与传统数据挖掘方法相比,它具有理论基础牢固、推理简单准确,且可以在丢失数据的不完备信息下进行推理等诸多优势,因此,基于Bayes网络的数据挖掘算法在通信编码、图像处理、生物医学工程等方面都具有相当广泛的应用。   由于Bayes网络的广泛应用,自然希望能够根据现有的先验知识和观测数据自动训练出对象间的Bayes网络,这就是Bayes网络的学习问题。这一问题可分为两类:参数学习和结构学习。所谓参数学习,就是在已知Bayes网络的结构(即所考虑对象间的条件独立性质)后,利用观测数据估计出个节点处的相应参数(即为已知该节点父亲节点时该节点的概率分布函数);结构学习指的是在考虑变量的相互关系未知的情况下,利用观测数据对它们之间的关系进行估计,从而训练出相应的Bayes网络结构。显然,结构学习是比参数学习更困难、更有挑战性的任务。   目前有关结构学习的算法研究主要分为两类:一类是基于条件独立性检测的算法。这类算法主要通过检查变量间鉴别信息或交叉熵等方法来判断变量间的条件独立性,再建立满足这些条件独立性的Bayes网络。该方法的计算量较小,在节点数不多的情况下准确度也较高,但在节点数较多的情况下,对条件独立性的不准确判断造成的误差会产生连锁反应,导致学习结果的准确性大大降低。第二类算法是基于评分-搜索的结构学习算法。这类算法首先确定一个能够反映Bayes网络准确度的评分函数,然后在满足节点数要求的全体Bayes网络中采用启发式搜索等办法,找出使得评分函数尽量大(或小)的网络作为学习结果。由于这一问题是NP问题,在节点数较大的情况下无法求出最优解,所以搜索算法一般为梯度下降、蒙特卡洛等次优算法。基于评分-搜索的结构学习算法因其出色的准确性和对观测数据的鲁棒性而成为结构识别算法中的主流。在基于评分-搜索的结构学习算法中,评分函数的选取对于学习结果的性能是具有关键性影响的。好的评分函数可以在模型的准确性与复杂性之间做出合适的权衡,对之后将学习结果用于推理时的效率会有很大提高,目前被广泛采用的评分标准有Bayes评分、BIC评分等。本文的目的即为研究这两种评分对于学习结果复杂性的影响。本文以下的部分将这样安排:第1部分介绍Bayes评分和BIC评分的原理;第2部分介绍仿真实验的设计;第3部分对实验结果进行初步分析;第4部分给出结论。   为了研究评分函数对于学习结果的影响,必须排除搜索算法可能造成的干扰。由于随着节点数的增加,全部可能的Bayes网络总数将以超指数的速度增长(见表1),因此对于节点数较多的情况,穷举搜索是不可能的。考虑到为了精确得到学习结果平均复杂度而需要进行的试验次数,本文中只对节点数为2、3、4的情况进行研究。   1 Bayes评分和BIC评分的原理   在基于评分-搜索的结构学习算法中,评分函数是用来衡量各Bayes网络对数据匹配程度的指标,其自变量为某Bayes网络结构,函数值越大(小),则该Bayes结构对数据匹配得越好。在定义评分函数时,往往考虑两个因素:模型匹配数据的精确程度和模型的复杂度。学习算法总是倾向于简单却精确匹配数据的Bayes网络结构。   目前广泛使用的评分函数主要有Bayes评分和BIC评分,下面分别介绍其原理:   1.1 Bayes评分   为了完全确定一个Bayes网络,仅仅知道其结构是不够的,还应当知道决定该结构下各变量条件概率的参数。图1所示的4节点Bayes网络,假设各节点均为布尔变量,则需要确定的自由参数共有   p(A=0),p(B=0|A=0),p(B=0|A=1),p(C=0|A=0),   p(C=0|A=1),p(D=0|C=0),p(D=0|C=1)共   7个。   在Bayes评分函数的定义过程中,假设所有的自由参数组成的参数向量为Θ,并记观测到的数据序列为X,则结

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档