第3章_概率密度函数的估计_非参数估计.pptVIP

第3章_概率密度函数的估计_非参数估计.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模 式 识 别 第3章 概率密度函数的估计 总体分布的非参数估计 前面的方法 密度函数的形式已知 存在问题 密度函数的形式常常未知 一些函数形式很难拟合实际的概率密度 经典的密度函数都是单峰的,而在许多实际情况中却是多峰的 总体分布的非参数估计 非参数估计 处理问题 直接用已知类别样本去估计总体密度分布p(x|ωi) 需要计算p(x|ωi)的每个点的值 方法 ①?用样本直接去估计类概率密度p(x|ωi)以此来设计分类器, 如窗口估计 ②?用学习样本直接估计后验概率p(ωi|x)作为分类准则来设计分类器如k近邻法. 总体分布的非参数估计 概率密度函数估计的基本思想 一个随机变量x落在区域R的概率为P 总体分布的非参数估计 估计概率P 假设有N个样本X=(x1, x2,… xN)T都是独立同分布的,概率密度函数是p(x)。 N个样本中有k个落入在R内的概率符合二项分布,即: 其中P是样本x落入R内的概率 Pk是k个样本落入R内的概率 总体分布的非参数估计 估计概率P 则随机变量k的数学期望: E(k)=NP k可以直接从训练样本估计得到 根据N个训练样本中落入区域R的样本数k,可得到概率P的一种估计,为: 总体分布的非参数估计 估计概率p(x) 设p(x)在R内连续变化 当R逐渐减小的时候,小到使p(x)在其上 几乎没有变化时,则: 总体分布的非参数估计 估计概率p(x) 密度p(x)的估计: 上式就是对x点概率密度p(x)的估计值 总体分布的非参数估计 p(x)估计值的收敛性讨论 当V固定的时候 N增加, k也增加, 当 时, 则k/N在概率上收敛 但我们只能得到p(x)的空间平均估计, 即 总体分布的非参数估计 p(x)估计值的收敛性讨论 N固定,体积V变小 当 时,如果k=0 当 时,如果k≠0 总体分布的非参数估计 p(x)估计值的收敛性讨论 考虑无限多样本情况 构造一串包括x的区域序列R1,R2,…RN. 对R1采用1个样本进行估计, 对R2采用2个样本进行估计, …… VN是RN的体积,KN是N个样本落入VN的样本数则 总体分布的非参数估计 p(x)估计值的收敛性讨论 若pN(x)收敛于p(x)应满足三个条件: 总体分布的非参数估计 两种非参数估计方法 Parzen窗口估计 使得序列VN以N的某个函数的关系不断缩小 并对随机变量kN和kN / N加上必要的限制条件,确保估计值的收敛 例如: kN近邻估计 让kN为N的某个函数,而VN的选取是使相应的RN正好包含x的kN个邻域 例如: Parzen窗口估计 Parzen窗口估计 Parzen窗口估计 保证估计量pN(x)为密度函数而对窗口函数的限制 Parzen窗口估计 窗函数 d=1,窗口为一线段 d=2,窗口为一平面 d=3,窗口为一立方体 d3,窗口为一超立方体 窗函数选择 Parzen窗口估计 窗函数宽度对幅度的影响 Parzen窗口估计 窗函数宽度对估计结果的影响 Parzen窗口估计 估计量pN(x)的性质 希望达到 Parzen窗口估计 估计量pN(x)的性质 限制条件 (1) pN(x)在x点连续 (2)窗函数满足 (3)窗宽受下列条件约束 Parzen窗口估计 kN近邻估计 窗函数法问题(对hN的选择问题) 若hN选太小,则大部分体积将是空的(即不包含样本),从而使PN(x)估计不稳定。 若hN选太大,则PN(x)估计较平坦,反映不出总体分布的变化 kN近邻法的思想 体积是数据的函数,而不是样本数N的函数 根据KN选择hN KN是N的函数 kN近邻估计 kN对估计结果的影响 kN近邻估计 * * 因此用非参数估计 ^ 本章只考虑第一种方法 p(x)是要求的x的概率密度 概率P是p(x)在区域R上平滑或平均后得到的概率 我们可以通过估计P来估计p(x)的平滑值 P R (V足够小) 真实概率是 0.7 横坐标是k/N 纵坐标是概率分布 ^ 而不是p(x)。 必须让体积V趋于零。 所以如果样本有限,则估计值一定有方差。 密度的第N次估计: ^ Parzen窗口估计 使得序列VN以N的某个函数的关系不断缩小 并对随机变量kN和kN / N加上必要的限制条件,确保估计值的收敛 KN近邻估计 让kN为N的某个函数,而VN的选取是使相应的RN正好包含x的kN个邻域 假设RN为一个d维的超立方体,hN为超立方体的长度 ∴超立方体体积为: 定义窗函数 落入超立方体的样本数为: 代入,得Parzen窗法的基本估计公式 ^ 窗函数越宽,幅度越小 二维正态对称Parz

文档评论(0)

wxc6688 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档