- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * 朴素贝叶斯分类 简单假定: 属性有条件地相互独立 (即属性之间不存在依赖关系): 如果 Ak 是分类属性, 则P(xk|Ci)是D中属性Ak的值为xk的Ci类的元组数除以D中Ci类的元组数 |Ci, D| 如果 Ak 是连续值属性, P(xk|Ci) 通常基于均值μ 和标准差σ 的高斯分布计算(假定连续值属性服从均值为μ 、标准差为σ 的高斯分布),由下式定义 * 朴素贝叶斯分类 Class: C1:buys_computer = ‘yes’ C2:buys_computer = ‘no’ 待分类数据: X = (age =30, Income = medium, Student = yes, Credit_rating = Fair) * 朴素贝叶斯分类: 例子 P(Ci): P(buys_computer = “yes”) = 9/14 = 0.643 P(buys_computer = “no”) = 5/14= 0.357 为每个类计算 P(X|Ci) P(age = “=30” | buys_computer = “yes”) = 2/9 = 0.222 P(age = “= 30” | buys_computer = “no”) = 3/5 = 0.6 P(income = “medium” | buys_computer = “yes”) = 4/9 = 0.444 P(income = “medium” | buys_computer = “no”) = 2/5 = 0.4 P(student = “yes” | buys_computer = “yes) = 6/9 = 0.667 P(student = “yes” | buys_computer = “no”) = 1/5 = 0.2 P(credit_rating = “fair” | buys_computer = “yes”) = 6/9 = 0.667 P(credit_rating = “fair” | buys_computer = “no”) = 2/5 = 0.4 X = (age = 30 , income = medium, student = yes, credit_rating = fair) P(X|Ci) : P(X|buys_computer = “yes”) = 0.222 x 0.444 x 0.667 x 0.667 = 0.044 P(X|buys_computer = “no”) = 0.6 x 0.4 x 0.2 x 0.4 = 0.019 P(X|Ci)*P(Ci) : P(X|buys_computer = “yes”) * P(buys_computer = “yes”) = 0.028 P(X|buys_computer = “no”) * P(buys_computer = “no”) = 0.007 因此, X 属于类(“buys_computer = yes”) * 避免零概率问题 朴素贝叶斯分类预测需要每个条件概率是非零的,否则,预测概率将会为零 例如,假设一个具有1000个元组的数据集, income=low (0), income= medium (990), 和 income = high (10) 使用拉普拉斯校准 (或拉普拉斯估计法) 每个组元组数加1 Prob(income = low) = 1/1003 Prob(income = medium) = 991/1003 Prob(income = high) = 11/1003 “校准的”概率估计与对应的“未校准的”估计很接近 * 朴素贝叶斯分类: 评价 优点 易于实施 大部分情况下可以获得好的结果 缺点 假设: 类条件独立,因此损失准确性 实际中, 属性之间经常存在依赖性 属性之间存在依赖的情况不能通过朴素贝叶斯分类建模 怎么处理这些依赖性? 贝叶斯信念网络 * 分类: 基本概念 分类: 基本概念 决策树 基于规则分类 贝叶斯分类方法 提高分类准确率的技术 小结 组合方法: 提高分类准确率 组合方法 把k个学习得到的模型, M1, M2, …, Mk, 组合在一起,旨在创建 一个改进的复合分类模型M* 流行的组合方法 装袋: 在一组分类器上平均预测 提升: 基于一组分类器的加权表决 * 给定一个待分类元组X,它收集由基分类器返回的类标号预测,并输出占多
您可能关注的文档
最近下载
- 2021届北京市海淀高三语文一模阅读部分讲评 课件(150张PPT).pptx
- 背负式风力灭火机的操作与使用 .ppt VIP
- 苏州七年级月考试卷及答案.doc VIP
- 山东科学技术版劳动实践指导手册三年级第11课公益劳动与志愿服务校园公益劳动清洁美化校园我行动 教案.docx VIP
- 2025年中级审计师测试题习题.docx VIP
- 一、毕业设计(论文)的目的和意义.doc VIP
- 四川大学软件学院2008级毕业设计启动会课程设计.ppt VIP
- 2025全科医生考试题及答案.docx VIP
- 大班科学标准教案小油滴不见了.pptx VIP
- 2024年隆昌市兴诚投资集团有限公司人员招聘考试题库及答案解析.docx VIP
文档评论(0)