核密度估计的概念与-Xueyayang.PDFVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
核密度估计的概念与-Xueyayang

核密度估计的概念与实验 June4,2014 1 问题 本文讲述核密度估计的概念与原理,同时给出一个实验。文章是参考 wikipedia上的定义1 23 及python中的scipy包 的源码写就的。 2 解答 2.1 概念 以函数估计打比方。现在手上有几个函数值 ,即平面上的几个 点。现在要从这个几个点,推测是从哪个函数中抽样的。如 , 等。如果得到函数的表达式,就可以得到在指定区间,如 内,任意 位置处的函数值了。 核密度估计是一样的概念。估计的是概率密度函数。 从几个样本,估计其服从的分布,即求出其概率密度函数。有了概率密 度函数以后,就可以得到在任意区间(值)处的概率了。 所以,核密度是一个从具体(样本)到普遍(概率密度函数)的过程。然 后再用普遍指导具体。 1/wiki/Kernel_density_estimation 2/doc/scipy/reference/generated/scipy.stats.gaussian_kde.html 3/scipy/scipy/blob/master/scipy/stats/kde.py 1 2 解答 2 2.2 如何估计 2.2.1 放草帽求平均 样本到底是从哪个分布中抽样的,我们不知道。不如假设每个样本都服 从高斯分布,在该点处做一个高斯分布的图形。有N个样本,就能得到N个 高斯分布。如wiki页面给出的图: 其中,6条短黑线,即6个样本;6个红草帽,即样本所在点的高斯分 布;一条蓝线,即密度估计的结果。有了这条蓝线,我们可以知道任意处的 函数值。 在[-5,10]的范围内,取任一点 为例,其所在处的值,认为等于N个 高斯分布在此处的平均值。即, (1) 更简洁(唬人)的写法是: ∑ (2) 如果说一个高斯分布是一个草帽的形状。上面这个过程就是一个放草 帽的过程。在所有的样本点处放一个草帽,然后所有草帽相加求平均。 2.2.2 为什么假定服从高斯分布? 4 选高斯分布的合理性在哪里?这跟中心极限定理 有关系。即,任何分 布,经过多次独立实验,最终都服从高斯分布。高斯分布的特殊性可见一斑。 4/wiki/Central_limit_theorem 2 解答

您可能关注的文档

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档