- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总39卷 第3期 数 学 研 究 V o l. 39 N o. 3
2006年9月 Jou rnal of M ath em at ical Study Sep. 2006
非参数回归函数的稳健Boo t strap
林少炜 林建华 吴绍凤
( 厦门大学数学科学学院, 福建 厦门 36 1005)
摘 要 在有异常值的数据中, Boo t strap 样本可能比原有样本含有更高的“污染”, 这会降低所
要做的统计推断的有效性. 本文讨论在非参数回归N - W 估计中, 如何利用影响函数得到重新抽
样的概率, 使用倾斜的Boo t strap 方法得到曲线的拟合, 从而达到有效地抵制异常值对回归函数影响
的目的, 数值模拟的结果表明这种处理方式的有效性.
关键词 非参数回归; Boo t strap ; 影响函数; 带宽选择
中图分类号 2 11. 1 文献标识码
O A
1 引 言
由于 目前越来越多的数据不适合用参数回归来进行数据拟合, 而非参数回归是基于数据
本身, 因此非参数回归方法的研究越来越受到人们的重视. 有关非参数回归的原理及其应用
的专著有许多, 如 [ 13 ]、 [ 9 ]、 [ 14 ] 和 [ 6 ] 等分别介绍了非参数回归
Eubank M u ller H ard le W ahba
在许多实际问题中的应用. 而自从七十年代末 E fron [ 1] 引入Boo t strap 方法后,Boo t strap 方法
有着广泛的运用, 如点估计、统计推断、曲线拟合、致信区间的构造等. 然而, 在回归函数中, 如
果数据中含有异常值时, 进行传统的Boo t strap 有很明显的缺陷, 即数据拟合的效果可能很不
理想[ 11 ] [ 12 ]. 造成这样问题的主要原因是每个数据点被以等概率抽取, 这样得到的Boo t
strap 样本可能受到比原始样本更大的“污染”, 由此导致可能数值结果失真. 然而若直接去掉
异常值进行估计或推断, 这就可能丢失了数据中的信息, 因此也不被人们接受. 对于这类数据
中含有异常值时, 稳健估计的Boo t strap 不失为一种有效的方法, 但也有一些数值例子表明, 仅
仅使用稳健估计的Boo t strap 还是不够的, Singh [ 11 ] 指出了即使估计有很高的崩溃点(b reak
dow n po in t) , 但在Boo t strap 中可能很低. 由于非参数回归函数估计几乎基于数据本身, 数据
中有异常值就需特别注意, 传统的Boo t strap 可能产生较大的偏差. 本文首先使用Am ado 和
P ires[2 ] 引入的一种倾斜Boo t strap , 其基本思想为使用加权经验分布, 即在经验分布F 中的数
据 有权重 .
X i p i
( j = i ) = i , , = 1, 2, …, .
P X X X p i j n
其中 j 为 的第 个样本. = { 1 , 2 , …, n }为原始样本, { 1 , 2 , …, n }构成一个
X Boo t strap j X X X X p p p
多项分布, 满足
文档评论(0)