- 88
- 0
- 约1.3万字
- 约 40页
- 2017-10-16 发布于浙江
- 举报
数据挖掘与知识发现(第2版) (40-*) 贝叶斯网络分类器 例5.1 使用朴素贝叶斯分类预测未知样本的类标号。给定Playtennis的训练样本集见表5.3。使用朴素贝叶斯分类来预测在<Outlook=Sunny, Temperature=Hot, Humidity=High, wind=Strong>的情况下,是否打球。 数据挖掘与知识发现(第2版) (40-*) 贝叶斯网络分类器 解:要分类的未知样本为: X =<Outlook=Sunny, Temperature=Hot, Humidity=High, wind=Strong> 每个类的先验概率P(Ci)可以根据训练样本计算: P(Playtennis=“yes”) = 9/14 = 0.643 P(Playtennis=“no”) = 5/14 = 0.357 为计算P(X |Ci),i=1, 2,先计算下面的条件概率: P(Outlook=“Sunny”| Playtennis =“yes”) = 2/9 = 0.222 P(Outlook=“Sunny”| Playtennis =“no”) = 3/5 = 0.600 P(Temperature=“hot”| Playtennis =“yes”) = 2/9 = 0.222 P(Temperature=“hot”| Playtennis =“no”) = 2 /5 = 0.400 P(Humidity=“high”| Playtennis =“yes”) = 3/9 = 0.333 P(Humidity=“high”| Playtennis =“no”) = 4/5 = 0.800 P( Windy=“Strong”| Playtennis =“yes”) = 3/9 = 0.333 P( Windy=“Strong”| Playtennis =“no”) = 3/5 = 0.600 利用以上概率,可以得到: P(X | Playtennis =“yes”) = 0.222×0.222×0.333×0.333 = 0.005 P(X | Playtennis =“no”) = 0.600×0.400×0.800×0.600 = 0.115 P(X | Playtennis =“yes”) P(Playtennis =“yes”) = 0.005×0.643 = 0.003 P(X | Playtennis =“no”) P(Playtennis =“no”)= 0.115×0.357 = 0.041 因此,将样本X指派给类C2:Playtennis =“no”。 即不去打球。 数据挖掘与知识发现(第2版) (40-*) 贝叶斯网络分类器 半朴素贝叶斯分类器 (Semi-Naive Bayesian Classifier, SNBC) 依照一定的标准将关联程度较大的特征属性合并在一起组合成新属性,各个组合属性之间也是相对于类别属性相互独立的。这里合并并不是真正上的合并,只是在计算中体现出来,是概念层次上的一个抽象过程。 SNBC模型限制网络的结构复杂度。 计算推导过程与朴素贝叶斯相同。 数据挖掘与知识发现(第2版) (40-*) 贝叶斯网络分类器 选择贝叶斯分类器(Selective Na?ve Bayesian Classifier) 使用属性集的子集作为决策过程中的属性结点,即选择贝叶斯分类器选择初始特征的子集作为属性结点。它通过搜索特征空间,去掉特征间具有较强依赖关系的属性。 应该着重考虑的问题: l. 搜索方向的选择 向前搜索是从空集开始,逐渐添加新的属性; 向后搜索是从整个属性集开始,逐渐移走相应的属性。 2. 搜索策略的选择。 算法考虑新增加的属性对分类性能的影响,选取最好的属性添加到当前的属性集中,然后继续下一次选择。贪婪搜索在最坏情况下的复杂度为O(m2)。 3. 各种属性子集下算法性能的度量准则 采用Leave-one-out技术从训练集中估计算法的精度,是交叉验证法中最精确的一种估计方法。 4. 停止搜索的标准。 当对新添加的任何属性都不能提高分类精度时,停止搜索; 只要分类精度不减少,就继续选择其他的属性加入到属性集中。 数据挖掘与知识发现(第2版) (40-*) 贝叶斯网络分类器 树增广朴素贝叶斯网络分类器(Tree Augmented Naive Bayesian, TAN) 扩展朴素贝叶斯的结构,使其能容纳属性间存在的依赖关系,但对其表示依赖关系的能力加以限制。 基本思想: 基于朴素贝叶斯分类器,在属性之间增添连接弧,称为扩展弧。 从结点Xi到Xj的扩展弧表示属性Xj对分类的影响也取决于Xi的
您可能关注的文档
- 设计研究岗位职责.doc
- 社会的黑难掩红色的心—读《红与黑》有感.doc
- 社会工作师初级实务试题及答案.doc
- 社会工作者 综合能力-初级.ppt
- 社会契约与文明社会.doc
- 社会工作者初级考试综合能力模拟试卷1-附答案.doc
- 社会工作者初级综合能力模拟试卷-附答案.doc
- 申泮文-近代化学导论-第1章-绪论.ppt
- 申泮文-近代化学导论-第0章-课前的话.ppt
- 申泮文-近代化学导论-第3章-2路易斯电子配对杂化价层.ppt
- 腾讯安全沙龙:红队视角下的海外SRC猎场:战略、战术与突破.pdf
- 【icap】ETS的范围扩展:设计和政策挑战.docx
- bcg -美国最高法院关于关税的裁决对你的企业意味着什么 What Does the US Supreme Court Ruling on Tariffs Mean for Your Business.pdf
- 2026届甘肃兰州市高三下学期第一次模拟考试历史试卷(扫描版,含答案).docx
- bcg -零售银行如何让人工智能代理发挥作用 How Retail Banks Can Put AI Agents to Work.pdf
- 住宅项目规范解读(GB 55038-2025) -培训 - 房地产-2025.docx
- 盘扣式脚手架工程量自动计算表 -培训 -房地产-2025.pdf
- 广东省汕头市2024-2025学年高三下学期第一次模拟考试英语学试题(含答案).docx
- 品牌研究+_+2025+CAPSE中国航司品牌榜单.pdf
- 【银河专题】如何看待豆粕内外价差关系.pdf
最近下载
- 宁夏风电场49.5MW工程风机吊装、风机变安装施工合同.doc VIP
- 市政工程造价管控措施.docx VIP
- 语言文字规范培训.pptx VIP
- 苯乙烯生产工艺的节能优化和经济分析.pdf VIP
- 2026年光伏组件回收技术报告.docx
- 2025至2030中国连续血糖监测(CGM)市场应用动态与前景趋势洞察报告.docx VIP
- 2025年10月自考00090《国际贸易实务(一)》试题及答案.docx VIP
- TPI-2021年02月25日:配备DQ500_DQ380_DQ381变速箱的车辆变速箱故障指示灯亮起并存储事件存储器条目P173500_P173600-VW(2061782-1).pdf VIP
- 教师与语言文字规范.pptx VIP
- 应征入伍服兵役高等学校学生国家教育资助申请表Ⅰ(模板).pdf VIP
原创力文档

文档评论(0)