模式识别第三章:类条件概率密度估计方法及其应用.pdfVIP

  • 2
  • 0
  • 约2.05千字
  • 约 7页
  • 2026-03-08 发布于北京
  • 举报

模式识别第三章:类条件概率密度估计方法及其应用.pdf

习题

•类条件概率密度估计的两种主要方法

和。

•类条件概率密度估计的非参数估计有两种

主要的方法和。它

们的基本原理都是基于样本对分布的

原则。

•如果有N个样本,可以计算样本邻域的体积

V,然后获得V中的样本数k,那么

P(x)=。

•假设正常细胞和癌细胞的样本的类条件概率服从多元正态

p(x|)N(μ,)i1,2

分布iii,使用最大似然估计方

法,对概率密度的参数估计的结果为。

•证明:使用最大似然估计方法,对一元正态概率密度的参

数估计的结果如下:

1N

x

ˆ

1k

Nk1

2N

1

ˆ2

2N(xk−)

k1

例题:

•已知5个样本和2个属性构成的数据集中,w1类有3个样本,

w2类有两个样本。如果使用贝叶斯方法设计分类器,需要

获得各类样本的条件概率分布,现假设样本服从多元正态

分布p(x|)N(μ,)i1,2,则只需获得分布的参

iii

数均值向量和协方差矩阵即可,那么采用最大似然估计获

得的w1类的类条件概率密度均值向量为,以及

协方差矩阵为。

属性1属性2类别

12W1

14W1

43W1

24W2

26W2

计算机求解:计算样本均值向量

和协方差矩阵

已知y-matrix(c(1,1,4,2,4,3),3,2)

计算均值向量apply(y,2,mean)

得到结果为23

用cov(y)*2/3计算样本协方差矩阵得:

[,1][,2]

[1,]20.0000000

文档评论(0)

1亿VIP精品文档

相关文档