分类-数据挖掘-韩家炜_3讲解.ppt

分类-数据挖掘-韩家炜_3讲解

Data Mining: Concepts and Techniques 本讲内容 贝叶斯分类 基于神经网络的分类 Bayesian Classification 是一种基于统计的分类方法,用来预测诸如某个样本属于某个分类的概率有多大 基于Bayes理论 研究发现,Na?ve Bayes Classifier在性能上和Decision Tree、Neural Network classifiers 相当。在应用于大数据集时,具有较高的准确率和速度 Na?ve Bayes Classifier假设属性值之间是独立的,因此可以简化很多计算,故称之为Na?ve 。当属性值之间有依赖关系时,采用Bayesian Belief Networks进行分类。 Bayesian Theorem: Basics 假设X是未知分类标号的样本数据 H代表某种假设,例如X属于分类C P(H|X): 给定样本数据X,假设 H成立的概率 例如,假设样本数据由各种水果组成,每种水果都可以用形状和颜色来描述。如果用X代表红色并且是圆的,H代表X属于苹果这个假设,则P(H|X)表示,已知X是红色并且是圆的,则X是苹果的概率。 Bayesian Theorem: Basics P(H): 任一个水果,属于苹果的概率. (不管它什么颜色,也不管它什

文档评论(0)

1亿VIP精品文档

相关文档