概率密度函数的估计.docVIP

下载本文档

5
0
约3.43千字
约 32页
2019-10-23 发布于天津
举报
版权申诉

概率密度函数的估计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

张学工《模式识别》教学课件 PAGE PAGE 31 Xuegong Zhang, Tsinghua 第三章　概率密度函数的估计 3.1　引言贝叶斯决策：已知和，对未知样本分类（设计分类器）实际问题：已知一定数目的样本，对未知样本分类（设计分类器）怎么办？一种很自然的想法：首先根据样本估计和，记和然后用估计的概率密度设计贝叶斯分类器。 ——（基于样本的）两步贝叶斯决策希望：当样本数时，如此得到的分类器收敛于理论上的最优解。为此，需重要前提：训练样本的分布能代表样本的真实分布，所谓i.i.d条件有充分的训练样本本章讨论内容：如何利用样本集估计概率密度函数？估计概率密度的两种基本方法：参数方法 (parametric methods) 非参数方法 (nonparametric methods) 基本概念参数估计(parametric estimation)：已知概率密度函数的形式，只是其中几个参数未知，目标是根据样本估计这些参数的值。几个名词：统计量(statistics)：样本的某种函数，用来作为对某参数的估计参数空间(parametric space)：待估计参数的取值空间估计量(estimation)： 3.2　最大似然估计(Maximum Likelihood Estimation) 假设条件： ① 参数是确定的未知量，（不是随机量） ② 各类样本集，中的样本都是从密度为的总体中独立抽取出来的，（独立同分布，i.i.d.） ③ 具有某种确定的函数形式，只其参数未知 ④ 各类样本只包含本类分布的信息其中，参数通常是向量，比如一维正态分布，未知参数可能是，此时可写成或。鉴于上述假设，我们可以只考虑一类样本，记已知样本为似然函数（likelihood function） —— 在参数下观测到样本集的概率（联合分布）密度基本思想：如果在参数下最大，则应是“最可能”的参数值，它是样本集的函数，记作。称作最大似然估计量。为了便于分析，还可以定义对数似然函数。求解：若似然函数满足连续、可微的条件，则最大似然估计量就是方程或的解（必要条件）。若未知参数不止一个，即，记梯度算子则最大似然估计量的必要条件由S个方程组成：讨论：如果或连续、可微，存在最大值，且上述必要条件方程组有唯一解，则其解就是最大似然估计量。（比如多元正态分布）。如果必要条件有多解，则需从中求似然函数最大者若不满足条件，则无一般性方法，用其它方法求最大（见课本均匀分布例）正态分布下的最大似然估计示例以单变量正态分布为例，，样本集似然函数对数似然函数最大似然估计量满足方程而得方程组解得 3.3　贝叶斯估计和贝叶斯学习（Bayesian Estimation and Bayesian Learning）贝叶斯估计思路与贝叶斯决策类似，只是离散的决策状态变成了连续的估计。基本思想：把待估计参数看作具有先验分布的随机变量，其取值与样本集有关，根据样本集估计。损失函数：把估计为所造成的损失，记为期望风险：其中, ，条件风险：最小化期望风险 ? 最小化条件风险（对所有可能的）有限样本集下，最小化经验风险：贝叶斯估计量：（在样本集下）使条件风险（经验风险）最小的估计量。损失：离散情况：损失函数表（决策表）；连续情况：损失函数常用的损失函数：（平方误差损失函数）定理3.1　请自学证明过程如果采用平方误差损失函数，则的贝叶斯估计量是在给定时的条件期望，即同理可得到，在给定样本集下，的贝叶斯估计是：求贝叶斯估计的方法：（平方误差损失下）（1）确定的先验分布（2）求样本集的联合分布（3）求的后验概率分布（4）求的贝叶斯估计量我们也可直接推断总体分布其中，。设的最大似然估计为，则在处很可能有一尖峰，若如此，且先验概率在处非零且在附近变化不大，则，即贝叶斯估计结果与最大似然估计结果近似相等。如的峰值不尖锐，则不能用最大似然估计来代替贝叶斯估计。考虑估计的收敛性：记学习样本个数，样本集时有因此有递推后验概率公式：设，则随着样本数增多，可得后验概率密度函数序列：，，