基于秩次的R类稳健回归.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于秩次的R类稳健回归.pdf

中国卫生统计2007年12月第24卷第6期 · 565 · 基于秩次的R类稳健回归* 中国医学科学院肿瘤研究所/医院流行病室(100021) 鲍彦平 山西医科大学公共卫生学院(o3o001) 王 彤△匝囹 【提 要】目的 从参数估计、稳健性质、回归诊断应用等方面介绍基于广义秩次的一类稳健回归分析方法一R和GR 估计。方法 在SAS的IML模块下模拟其对非正态误差分布表现、正态误差下的估计效率并进行实例分析。结果 误 差为cauchy分布时,R估计优于LS估计,X空间存在离群值时,GR估计优于R和LS估计,误差为正态分布时,R与CR 估计效率达95%。结论 R和GR估计为是一种估计效率较高的稳健回归方法,其中GR估计可同时避免x和Y空间离 群点。 【关键词】 稳健估计 回归诊断 秩次 经典的线性回归模型最小二乘(LS)估计不满足 R估计函数如下定义: 线性、独立、正态、方差齐四个条件时其统计推断结论 DR( )=∑口(R(r ))( ) 会变得不可靠。针对于此,一些对误差分布要求不太 其中 =Y —z 为残差,R(r )为残差的秩次, 敏感的稳健回归(robust regression)方法被提出用于解 口(R(r ))为残差秩次的得分函数。得分函数n(i)= 决此问题【1J。 (i/( +1)),其中最常用的是Wilcoxon得分函数: 当方差分析的正态性前提条件不能满足时,人们 (U)=√12(U一1/2)。代入上面定义式,得到此估计 引入基于观测值的秩次来建立非参数分析方法,这类 的目标函数为: 对于误差分布要求也具有稳健性的各种“秩和检验”方 法已得到广泛应用,因而当回归分析中面临同样的问 DR( )= ∑[R(Ti)一 ]r 题时,很自然的想到了将该思想扩展到这一领域,于是 对其求极小,可得到相应偏回归系数的Wilcoxon Jackel及以后多位学者逐步提出并完善了一系列基于 R估计值。 秩次的回归分析方法,称为R估计l2.3]。该方法不将 GR估计函数如下: 残差取平方,而是将残差的秩次的某种函数作为离群 D6n( )= lJ y一 IJ = lJ U lJ = 点(outliers)的降权函数引入估计模型,这样可以减小 ∑∑b I“ 一 I,其中“ 为残差,b 为正的对称权 离群点对估计量的影响,从而达到稳健性要求。但注 重函数,b =6 当 b j:1时,该方程就退化为 意到R估计的影响函数(influence function)只在Y空 间上有界,而在x空间上无界,对于非设计后的回归 Wiloxon R估计。 问题还不能有效抵抗x方向上的异常。因此Table— R估计本身可以抵抗Y方向上大约30%的离群 man等人又提出一类GR(Generalized R)估计方法l4J, 点的影响,但对于x空间的异常就要借助选择合适的 该方法将x方向上离中心位置距离的某些函数作为 b 作为权重函数来减小其影响。一般情况下,b 的决 残差的权重函数的一部分,用降权的方法减少了影响 定方法如下: 点对回归估计的作用,其中心是降权函数的选择。这 bi=mini1,Cl/、/h to, 些基于秩次的R类估计不要求误差项服从正态分布, 其中a1=2,hff为某观测点的杆杠值 ,表示x方向上 这一点使它相对于经典的正态误差回归模型具有一定 该点离中心位置的远近,C1为杠杆值的第30百分

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档