- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
拉普拉斯修正 若某个属性值在训练集中没有与某个类同时出现过,则直接计算会出现问题,. 比如“敲声=清脆”测试例,训练集中没有该样例,因此连乘式计算的概率值为0,无论其他属性上明显像好瓜,分类结果都是“好瓜=否”,这显然不合理。 拉普拉斯修正 若某个属性值在训练集中没有与某个类同时出现过,则直接计算会出现问题,. 比如“敲声=清脆”测试例,训练集中没有该样例,因此连乘式计算的概率值为0,无论其他属性上明显像好瓜,分类结果都是“好瓜=否”,这显然不合理。 为了避免其他属性携带的信息被训练集中未出现的属性值“抹去”,在估计概率值时通常要进行“拉普拉斯修正”(Laplacian correction) 令 表示训练集 中可能的类别数, 表示第 个属性可能的取值数,则式 (7.16)和 (7.17)分别修正为 现实任务中,朴素贝叶斯分类器的使用:速度要求高,“查表”;任务数据更替频繁,“懒惰学习” (lazy learning);数据不断增加,增量学习等等。 章节目录 贝叶斯决策论 极大似然估计 朴素贝叶斯分类器 半朴素贝叶斯分类器 贝叶斯网 EM算法 半朴素贝叶斯分类器 为了降低贝叶斯公式中估计后验概率的困难,朴素贝叶斯分类器采用的属性条件独立性假设;对属性条件独立假设记性一定程度的放松,由此产生了一类称为“半朴素贝叶斯分类器” (semi-na?ve Bayes classifiers) 半朴素贝叶斯分类器 为了降低贝叶斯公式中估计后验概率的困难,朴素贝叶斯分类器采用的属性条件独立性假设;对属性条件独立假设记性一定程度的放松,由此产生了一类称为“半朴素贝叶斯分类器” (semi-na?ve Bayes classifiers) 半朴素贝叶斯分类器最常用的一种策略:“独依赖估计”(One-Dependent Estimator,简称ODE),假设每个属性在类别之外最多仅依赖一个其他属性,即 其中 为属性 所依赖的属性,称为 的父属性 对每个属性 ,若其父属性 已知,则可估计概值 ,于是问题的关键转化为如何确定每个属性的父属性 SPODE 最直接的做法是假设所有属性都依赖于同一属性,称为“超父” (super-parenet),然后通过交叉验证等模型选择方法来确定超父属性,由此形成了SPODE (Super-Parent ODE)方法。 图7.1 朴素贝叶斯分类器与两种半朴素分类器所考虑的属性依赖关系 在图7.1 (b)中, 是超父属性。 TAN TAN (Tree augmented Na?ve Bayes) [Friedman et al., 1997] 则在最大带权生成树 (Maximum weighted spanning tree) 算法 [Chow and Liu, 1968] 的基础上,通过以下步骤将属性间依赖关系简约为图7.1 (c)。 计算任意两个属性之间的条件互信息 (conditional mutual information) 以属性为结点构建完全图,任意两个结点之间边的权重设为 构建此完全图的最大带权生成树,挑选根变量,将边设为有向; 加入类别节点y,增加从y到每个属性的有向边。 AODE AODE (Averaged One-Dependent Estimator) [Webb et al. 2005] 是一种基于集成学习机制、更为强大的分类器。 尝试将每个属性作为超父构建 SPODE 将具有足够训练数据支撑的SPODE集群起来作为最终结果 其中, 是在第 个属性上取值 的样本的集合, 为阈值常数 其中, 是在第 个属性上取值数, 是类别为 且在第 个属性上取值为 的样本集合, 章节目录 贝叶斯决策论 极大似然估计 朴素贝叶斯分类器 半朴素贝叶斯分类器 贝叶斯网 EM算法 贝叶斯网 贝叶斯网 (Bayesian network)亦称“信念网”(brief network),它借助有向无环图 (Directed Acyclic Graph, DAG)来刻画属性间的依赖关系,并使用条件概率表 (Conditional Probability Table, CPT)来表述属性的联合概率分布。 贝叶斯网 贝叶斯网 (Bayesian network)亦称“信念网”(brief network),它借助有向无环图 (Directed Acyclic Graph, DAG)来刻画属性间的依赖关系,并使用条件概率表 (Conditional Pr
您可能关注的文档
- 湘教版八下第七章第二节澳门特别行政区的旅游文化特色.ppt
- 高中物理必修二-宇宙航行-专题练习解析.doc
- 商铺租赁合同协议文本.doc
- 箱梁支架安全技术交底.docx
- 人教版八年级物理 上册 第五章 第3节 凸透镜成像的规律(.ppt
- 第2篇-金融中介和金融市场---1.-我国的金融中介体系.ppt
- 嵌入式毕业设计任务书选录.doc
- 三个意、四个一(190916南京华江)--.ppt
- 江苏省 苏科版 初三物理 上学期 第十四章 欧姆定律 第一节 电阻 填空.doc
- 华东师大版(上海)历史第二册4.封邦建国与礼乐文化教案设计.doc
- GB/Z 10062.20-2025锥齿轮承载能力计算方法 第20部分:胶合承载能力计算 闪温法.pdf
- 中国国家标准 GB/Z 10062.20-2025锥齿轮承载能力计算方法 第20部分:胶合承载能力计算 闪温法.pdf
- 《GB/T 46713.1-2025轨道交通 机车车辆 辅助供电系统蓄电池 第1部分:通用要求》.pdf
- GB/T 46713.1-2025轨道交通 机车车辆 辅助供电系统蓄电池 第1部分:通用要求.pdf
- 中国国家标准 GB/T 46713.1-2025轨道交通 机车车辆 辅助供电系统蓄电池 第1部分:通用要求.pdf
- 《GB 19079.19-2025体育场所开放条件与技术要求 第19部分:拓展场所》.pdf
- 中国国家标准 GB 19079.19-2025体育场所开放条件与技术要求 第19部分:拓展场所.pdf
- GB 19079.19-2025体育场所开放条件与技术要求 第19部分:拓展场所.pdf
- GB/T 4937.25-2025半导体器件 机械和气候试验方法 第25部分:温度循环.pdf
- 中国国家标准 GB/T 4937.25-2025半导体器件 机械和气候试验方法 第25部分:温度循环.pdf
原创力文档


文档评论(0)