- 10
- 0
- 约2.48千字
- 约 12页
- 2016-06-06 发布于湖北
- 举报
应用多元统计实验报告 梦晴 朴素贝叶斯分类算法 算法简介 算法描述 算法优点 算法流程 算法实例 算法结果分析 算法简介 算法描述 (3)由于P(X) 对于所有类为常数,只需要P(X |Ci)P(Ci)最大即可。如果类的先验概率未知,则通常假定这些类是等概率的;即,P(C1) = P(C2) = ... = P(Cm)。并据此对P(Ci | X)最大化。否则,我们最大化P(X |Ci)P(Ci)。注意,类的先验概率可以用P(Ci) = si /s计算;其中,si是类C中的训练样本数,而s是训练样本总数。 (4)给定具有许多属性的数据集,计算P(X |Ci)的开销可能非常大。为降低P(X |Ci)计算的开销,可以做类条件独立的朴素假定。给定样本的类标号,假定属性值相互条件独立,即在属性间,不存在依赖关系。这样, 概率P(X1|Ci),P(X2|Ci),…P(Xn|Ci)可以由训练样本估值,其中 (a)如果Ak是连续值属性,则P(Xk|Ci)=Sik/Si,其中Sik是在属性Ak上具有值Xk的类Ci的样本数,而Si是Ci中的训练样本数。 (b)如果Ak是连续值属性,则通常假定该属性服从高斯分布,因而, 其中,给定类Ci的训练样本属性Ak的值, 是属性Ak的高斯密度函数,而 分别为平均值和标准差。 (5)为对未知样本X分类,对
您可能关注的文档
最近下载
- Micromeritics ASAP2020 全自动物理和化学吸附用户手册.pdf
- 甲醇精馏塔毕业设计(优.选).docx VIP
- 2026届高考必备名著阅读之《红楼梦》复习课件.pptx VIP
- 计算机应用基础 实训项目四 PowerPoint 综合应用.ppt VIP
- 施耐德培训讲义04开关的选择性、限流和级联技术介绍教学文稿.ppt VIP
- (辐射防护与核安全)辐射防护工程试题及答案.doc VIP
- 20S515 钢筋混凝土及砖砌排水检查井.docx VIP
- 新材料专题:微玻纤无边界成长.pdf
- 七年级历史期末考试卷.docx VIP
- GB30871-2022动火作业票填写模板.docx VIP
原创力文档

文档评论(0)