- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析核密度估计方法.pdf
理论广 角
China scienceandTechnologyReview ●I
浅析核密度估计方法
曹哲铭 尹立子
aE京英大长安风险管理咨询有限公司 100051)
中图分类号:0157.5 文献标识码 :A 文章编号:1009—914X(2014)37—0345一O1
1.核密度估计概念 (meat1integratedsquareerror)MISE h【】,他们他们之 I均关系式为
kerneldensityestimation是在概率论中用来估计未知的密度函数 ,属 MISE(h)=IMSE(~.()
于非参数检验方法之一,litRosenblatt(1955)和EmanuelParzen(1962)提 出,
又名Parzen窗(Parzenwindow)Ruppert和Cline基于数据集密度 函数聚类 = fE1()一()Idx‘
算法提出修订的核密度估计方法。由给定样本点集合求解随机变量的分布密度 = 1w{Z()+f(6l{()})出
函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和
非参数估计。参数估计又可分为参数回归分析和参数判别分析。在参数回归分
析中,人们假定数据分布符合某种特定的性态 ,如线性、可化线性或指数性态 : J()“d+。(]+_4兰[! +。()·
等,然后在 目标函数族中寻找特定的解 ,即确定回归模型中的未知参数。在参数 N[II~MISE(h)=AMISE(h) 去【 J‘
判别分析中,人们需要假定作为判别依据的、随机取值的数据样本在各个可能
的类别中都服从特定的分布。经验和理论说明,参数模型的这种基本假定与实
际的物理模型之间常常存在较大的差距 ,这些方法并非总能取得令人满意的结 AMISE( +
果。由于上述缺陷,R0s∞b]attjI砸Parzen提出了非参数估计方法,即核密度估计 对 求导 :—oAMIsE - K(u)Zdu
(h):I
方法.由于核密度估计方法不利用有关数据分布的先验知识 ,对数据分布不附 — 一 — — + (』“j}))[『/(x)]搠 :。
加任何假定,是一种从数据样本本身出发研究数据分布特征的方法,因而,在统
计学理论和应用领域均受到高度的重视
2.核函数的意义以及常见核函数 l j
对于数据 2x3… ·· 核密度估计(keneraldensityestimation)有如
但该结果用处并不很大,因为它依赖于朱知密度f,注意最优带宽有
下形式()=喜 【J = 。 lj,这种N~TMISE=。l”j,该结果显示了随着样本量的增加带
这是一个加权平均,而核函数(kemalfimction)K(·)是一个权函数.核
宽缩小的速度,但对给定的数据集来说它并未指明带宽具体取多少对密度估计
函数的形状和值域控制着用来估计厂(x)在点 的值时所用数据点的个数和利
是合适的.TN~t/l一种简化方法:拇指法:简
文档评论(0)