清华大学模式识别-03_第3章概率密度函数的估计资料.docVIP

下载本文档

3
0
约2.76万字
约 36页
2017-05-11 发布于湖北
举报

清华大学模式识别-03_第3章概率密度函数的估计资料.doc

清华大学模式识别-03_第3章概率密度函数的估计资料

第3章概率密度函数的估计 3.1 引言在第2章中，我们讨论了设计贝叶斯分类器的方法，即在先验概率和类条件概率密度已知的情况下，按一定的决策规则确定判别函数和决策面。但在实际工作中，类条件概率密度常常是未知的。以例2.1来说，我们不可能直接知道先验概率和类条件概率密度。但是我们可能从经验中知道玉米和杂草的大致比例，因而可能推断出先验概率。此外我们还可能得到一些玉米和杂草的样本。这就需要我们从这些样本中去估计出玉米和杂草的类概率密度及。这就是本章要讨论的有关概率密度函数的估计问题。在实际中，我们能收集到一些样本，而未知的则可能是：类条件概率密度，即各类的概率密度分布；先验概率。我们的最终任务是利用样本集设计分类器。一个很自然的想法是把分类器设计过程分为两步：第一步，利用样本集估计和，分别记为和。解决这样的问题可以利用统计推断中的估计理论。第二步，再将估计量和代入第2章的贝叶斯决策规则中，完成分类器设计。我们将这样的分类器设计过程称为基于样本的两步贝叶斯决策。利用两步贝叶斯决策方法得到的分类器性能与第2章理论上的贝叶斯分类器有所不同。我们希望当样本数目时，基于样本的分类器能收敛于理论上的结果。为此，只要说明时，和收敛于和就可以了。这在统计学中可通过对估计量性质的讨论来解决。一旦得到了和，我们就可以利用第2章的方法实现一个分类器。因此，我们本章的主要任务是利用样本集估计

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

清华大学模式识别-03_第3章概率密度函数的估计资料.docVIP