- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率密度估计与非参数回归
曾焰
版本 1.0,最后修订于2017-11-05
摘要
陈希孺等 [1] 第六章的内容摘要。
1 概率密度估计
1.1 几种重要的密度估计方法
1. 直方图法。这个方法可描述如下:假设随机变量 有密度 ,并有 的独立同分布样本 ,
, 。选择一个适当的正数,把全直线分为一些长为 的区间。任取这些区间之一,记为 。对
,我们有
∑
(1.1)
这一方法重要的是 的选择。 太大了,平均化的作用突出了,而淹没了密度的细节部分。太小
了,则受随机性影响太大,而产生极不规则的形状。 的选择无现成规则可循。实际操作中,我们可能
需要取一些不等长的区间,这样的直方图估计称为“Data-based ”的直方图估计。
直方图估计的优点是简单易行,缺点是它不是连续函数(这可以通过适当地修匀来解决),且从统
计角度看一般说效率较低。例如,在这一方法下,每一区间中心部分密度估计较准,而边缘部分则较差。
2. Rosenblatt 法。为克服直方图法的一个缺点——对每个区间边缘部分密度值的估计较差,
[ ] ,
Rosenblatt 在 1955 年提出了一个简单的改进。指定一个正数 ,对每个,定义
并对密度函数 作如下估计
∆ ∑
(1.2)
Rosenblatt 法与直方图法不同之处仅在于,它事先不把分割区间定下来,而让区间随着要估计之点
跑,使 始终处在区间之中心位置,而获致较好的效果。理论上可以证明,从估计量与被估计量接近
的数量级上看,Rosenblatt 方法确实优于直方图法。
3. Parzen 的核估计。直观上可以设想:为估计 ,与 靠近的样本,所起作用似应比远离
的样本要大些。这些在Parzen 于 1962 年提出的核估计方法中都得到了体现。为介绍 Parzen 的思想,
我们先将 (1.2) 式变换一个形式,引进一个函数
1
1 概率密度估计 2
则 (1.2) 式可改写为
( )
∑
您可能关注的文档
最近下载
- 第一次月考卷(苏州专用)-2024-2025学年八年级数学上学期第一次月考模拟卷(江苏专用).docx VIP
- 遥感概论第3章:遥感平台与遥感成像原理.ppt VIP
- 国际投资(第六版)在线解答手册(即课后习题答案) M04_SOLN8117_06_SM_C04.doc VIP
- 铁路工程—按工程施工阶段投入劳动力情况表.docx VIP
- 中央八项规定精神解读.pptx VIP
- 三年级数学下册口算题(每日一练,共43套).pdf VIP
- 国际投资(第六版)在线解答手册(即课后习题答案) M03_SOLN8117_06_SM_C03.doc VIP
- 供应商质量管理-供应商质量管理.doc VIP
- 实验室安全管理方案.doc
- 关于医院“十五五”发展规划(2026-2030).docx VIP
文档评论(0)