第7章 贝叶斯网络资料.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘 第7章 贝叶斯网络 * 贝叶斯网络是20世纪80年代发展起来的,最早由Judea Pearl于1986年提出,多用于专家系统,成为表示不确定性知识和推理问题的流行方法。 贝叶斯网络最早起源于贝叶斯统计分析,它是概率理论和图论相结合的产物。 本章通过引例讨论贝叶斯网络需要解决的问题;介绍贝叶斯概率基础;对贝叶斯网络进行概述;讲解贝叶斯网络的预测、诊断和训练算法;讲述 SQL Server 2005中贝叶斯网络的应用方法。 7.l 引例 先看一个关于概率推理的例子。图7.1中有6个结点:参加晚会(party,PT)、宿醉(hangover,HO)、患脑瘤(brain tumor,BT)、头疼(headache,HA)、有酒精味(smell alcohol,SA)和X射线检查呈阳性(posxray,PX)。可以把图7.1想象成为这样一个场景:一个中学生回家后,其父母猜测她参加了晚会,并且喝了酒;第二天这个学生感到头疼,她的父母带她到医院做头部的X光检查…… 图7.1 基于结点间概率关系的推理? 通过长期的观察,或者从别人那里了解,这个中学生的父母知道他们的女儿参加晚会的概率。通过长时间的数据积累,他们也知道他们的女儿参加晚会后宿醉的概率。因此,结点party和结点hangover之间有一条连线。同样,有明显的因果关系或相关关系的结点之间都有一条连线,并且连线从原因结点出发,指向结果结点。 针对图7.1所示的网络,有许多问题需要解决。例如: 1)如果父母已知他们的女儿参加了晚会,那么第二天一早,她呼出的气体中有酒精味的概率有多大?也就是说,当party发生时,smell alcohol发生的概率有多大? 2)如果他们的女儿头疼,那么她患脑瘤的概率有多大?这时,如果他们又知道昨晚她参加了晚会,那么综合这些情况,她患脑瘤的可能性有多大? 这两个例子都是从原因推理结果的。还有许多从结果反推原因的例子。例如,如果父母早晨闻到他们的女儿呼出的气体中有酒精味,那么她昨晚参加晚会的概率有多大?等等。 为了系统地解决上面的各类问题,需要先掌握一定的概率基础知识。 7.2贝叶斯概率基础 贝叶斯概率是贝叶斯网络运行的理论基础。就贝叶斯概率而言,其原理和应用都比较简单。但贝叶斯概率理论经历了长时间的波折才被逐渐认可,直到20世纪60年代,贝叶斯概率理论才被广泛接受并大量应用。下面将从基本的条件概率公式和全概率公式入手介绍贝叶斯概率。 7.2.1 先验概率、后验概率和条件概率 下面介绍贝叶斯概率中用到的有关概率论的基本概念。 (1)先验概率。先验概率是指根据历史的资料或主观判断所确定的各种事件发生的概率,该概率没有经过实验证实,属于检验前的概率。 (2)后验概率。后验概率一般是指通过贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率修正后得到的更符合实际的概率。 (3)条件概率。当条件确定时,某事件发生的条件概率就是该事件的条件概率。 例如,1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放人2号箱,然后从2号箱随机取出一球,问从2号箱取出红球的概率是多少? 【解】令A表示事件“最后从2号箱中取出的是红球”;令B表示从1号箱中取出的是红球。则 由式(7—5) : 7.2.3全概率公式 设A,B是两个事件,那么A可以表示为: 显然, 如果P(B),P(B)>0,则: 上例采用的方法是概率论中常用的方法,为了求复杂事件的概率,往往可以把它分解成若干个互不相容的简单事件,然后利用条件概率和乘法公式,求出这些简单事件的概率,最后利用概率可加性,得到最终结果,这一方法的一般化就是所谓的全概率公式。 设Ω为试验E的样本空间,A为E的事件,B1,B2,…,Bn为E的一组事件,若满足以下两个条件: 则称B1,B2,…,Bn为样本空间Ω的一个分割。 若B1,B2,…,Bn为样本空间的一个分割,那么,对每一次试验,事件B1,B2,…,Bn必有一个且仅有一个发生。 例如,设实验E为“掷一颗骰子观察其点数”。它的样本空间Ω={1,2,3,4,5,6)。 Ω的一组事件B1={l,2},B2={3,4),B3={5,6}是样本空间Ω的一个分割。而事件组B1={1,2,3),B2={3,4),B3={5,6)不是样本空间Ω的一个分割,因为B1B2={3}≠?。 设实验E为样本空间,A为E的事件,B1,B2,…,Bn为Ω的一个分割,且P(Bi)>0,i=1,2,…,n,则 式(7—6)被称为全概率公式。 【例】甲、乙、丙三人向同一飞机射击。设甲

文档评论(0)

mbxy007 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档