- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DATA MINING(CH5)
第5章 贝叶斯网络 《数据挖掘与知识发现》(第2版) 吉林大学计算机科学与技术学院 李雄飞 贝叶斯网络 贝叶斯网络(Bayesian Networks)结合图论和统计学方面的知识,提供了一种自然表达因果信息的方法,用于表达随机变量之间复杂的概率不确定性,发现数据间的潜在关系。 本章介绍如下几个方面的内容: 贝叶斯网络基本概念 不确定性推理与联合概率分布 贝叶斯网络中的独立关系 贝叶斯网络学习 贝叶斯网络分类器 引言 贝叶斯网络将图论和统计学相结合,用于表达随机变量之间复杂的概率不确定性,发现数据间的潜在关系。 优点: (1)知识表示形式更加直观。 (2) 对于问题域的建模,当条件或行为等发生变化时,不需要修正模型。 (3)以图形化表示随机变量间的联合概率,处理不确定性信息。 (4)没有确定的输入或输出结点,结点之间相互影响,可以用于估计预测。 (5) 将知识表示与知识推理结合统一为整体。 1988年,Pearl建立了贝叶斯网基础理论体系,将概率理论和图论有机结合,用一种紧凑的形式表示联合概率分布。 贝叶斯网络基本概念 给定一个随机变量集X={X1,X2,…,Xn},其中Xi是一个m维向量。贝叶斯网络说明X上的联合条件概率分布。定义为 G是有向无环图,节点分别对应于有限集X中的随机变量X1,X2,…,Xn ,每条弧代表一个函数依赖关系。 如果有一条由变量Y到X的弧,则Y是X的双亲(直接前驱),X是Y的后继。 Xi的所有双亲变量用集合Pa (Xi)表示。 一旦给定双亲,图G中的每个变量就与其非后继节点相独立。 代表用于量化网络的一组参数。对于Xi的取值xi,参数 贝叶斯网络表明变量集合X上的联合条件概率分布: 贝叶斯网络基本概念 贝叶斯网络提供一种方便表示因果知识的途径。 网络内节点可以选作“输出”节点,代表类标号属性。可以有多个输出节点。分类过程返回类标号属性的概率分布,预测每个类的概率。 不确定性推理与联合概率分布 不确定性的主要来源: ⑴领域专家对自己掌握知识的不确定性; ⑵所要建模的领域本身内在的不确定性; ⑶知识工程师试图翻译、表示知识所产生的不确定性; ⑷关于知识自身的精确性和知识获取方面存在的不确定性。 使用概率方法进行不确定性推理的步骤: ①将待处理问题域抽象为一组随机变量的集合X={X1,X2,…,Xn} ; ②把关于该问题的知识表示为一个联合概率分布P(X); 按照概率论原则进行推理计算。 例(Alarm问题):Pearl教授的家里装有警铃,地震和盗窃都可能触发警铃。听到警铃后,两个邻居Marry和John可能会打电话给他。如果Pearl教授接到Mary的电话,说听到他家警铃响,那么Pearl教授家遭盗窃的概率是多大? 不确定性推理与联合概率分布 5个随机变量: 盗窃(Burgle,B) 接到John的电话(John Call,J) 地震(Earth Quake,E) 接到Marry的电话(Marry Call,M) 警铃响(Alarm,A) 不确定性推理与联合概率分布 从联合概率P(A, B, E, J, M)出发,先计算边缘分布 (5.4) 得到联合概率边缘化分布: 再按照条件概率定义,得到 不确定性推理与联合概率分布 问题: 随着变量数目增加,联合概率分布的参数个数成指数级增长。 n个二值随机变量的联合概率分布包含2n-1个独立参数。 当变量很多时,联合概率的获取、存储和运算都十分困难。 在六、七十年代,大多数学者认为概率论不适合于解决人工智能中的不确定性问题。 贝叶斯网络中的独立关系 利用变量间的条件独立关系可以将联合概率分布分解成多个复杂度较低的概率分布,从而降低模型复杂度,提高推理效率。 例如:由链规则可以把联合概率分布P(A, B, E, J, M)改写为: 独立参数:1+2+4+8+16=31 E与B相互独立, 即P(E|B)=P(E) 给定A时,J与B和E相互独立, 即P(J|B, E, A)=P(J|A) 给定A时,M与J、B和E都相互独立,即P(M|J, A, B, E)=P(M|A) 则有: 独立参数:l+2+4+2+2=11 贝叶斯网络中的独立关系 利用链规则将包含n个变量的联合分布 写为: 对
您可能关注的文档
- chapter1-1概述.ppt
- chapter11.ppt
- CHAPTER13第13章 工业企业供电及安全用电.ppt
- chapter16糖.ppt
- chapter2-2.ppt
- chapter20生物.pdf
- chapter4_存储器管理.ppt
- chapter5-财产保险.ppt
- chapter6简化磁路使用.ppt
- chapter7粘弹性.ppt
- 2025年南通科技职业学院单招(语文)测试模拟题库完整版.docx
- 2025年南阳农业职业学院单招语文测试题库必考题.docx
- 2025年南开大学滨海学院单招(语文)测试题库及完整答案一套.docx
- 2025年南京科技职业学院单招语文测试题库及参考答案1套.docx
- 大学生就业指导 课件 第6章 就业权益与法律保障.pptx
- 新视野大学英语(第四版)读写教程4(思政智慧版)课件 B4U5 Passion guides life choices Section B.pptx
- 走进信息技术应用创新 课件 第1章 认识信息化产业 (4).pptx
- 通信线路施工与维护 课件 第2章 通信线路施工前准备.pptx
- 通信线路施工与维护 课件全套 (夏贵进) 第1--8章 通信线路基础--- 通信线路障碍处理.pptx
- 2024_2025学年新教材高中英语UNIT4HISTORYANDTRADITIONSSectionⅡDiscoveringUsefulStructures学案新人教版必修第二册.doc
最近下载
- 六年级数学《圆的对称性》C1跨学科学习活动设计学习活动方案学生成果及点评.pdf VIP
- 高低压变配电工程施工招标文件.pdf VIP
- 变电站施工合同协议书范本.docx
- 《分级护理制度》课件.ppt VIP
- 2024年检验类之临床医学检验技术(士)真题精选附答案 .pdf VIP
- J B∕T 13202.4-2017 -柴油机 颗粒捕集系统 第4部分:颗粒捕集器技术条件.pdf
- 2.蜗牛的坚持 课件(共19张PPT内嵌视频) 人教版一年级美术上册02.ppt.pptx VIP
- 软科2024年中国大学排名 .pdf VIP
- DB37_T 5174-2021 山东省沿海地区建筑工程风压标准.docx
- 小学跨学科教学的评价与反馈.docx
文档评论(0)