- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
岭回归分析中广义岭估计一种改进方法
岭回归分析中广义岭估计一种改进方法
【摘要】对于多重共线性条件下线性回归模型系数的有偏估计,统计学家提出了岭回归估计,Hoerl和Kennard提出了广义岭估计[1].本文主要讨论广义岭估计的进一步推广,基于均方误差和均方残差的比较,给出一种解决问题的新方法.
【关键词】线性回归模型;广义岭估计;均方误差;均方残差
一、引言
为消除或减弱设计阵的复共线性对参数估计的不良影响,国内外学者提出了各种有偏估计,如,岭估计[2]、主成分估计等等,这些估计在均方误差意义下可以优于LS估?[3].但是,在某种情况下还有一定的缺陷.
定义1[4]我们引进线性回归模型的典则形式:
Y=Zα+ε,E(ε)=0,Cov(ε)=σ2In,(1)
这里,Z=XΦ称为典则变量,α=Φ′β称为典则参数,其中Φ=(φ1,φ2,…,φp),且φ1,φ2,…,φp为X′X的对应特征根λ1≥λ2≥…≥λp0的标准化特征向量.所以Z′Z=Λ=diag(λ1,λ2,…,λp).则α的LS估计为=(Z′Z)-1Z′Y=Λ-1Z′Y.其狭义岭估计为(k)=(Λ+kI)-1Z′Y=(Λ+kI)-1Φ′X′Y.在岭回归估计法的基础上,有学者提出了广义岭回归估计法,定义为β(k)=(X′X+ΦKΦ′)-1X′Y,其中K=diag(k1,k2,…,kp)0.
本文主要是在前人提出的广义岭估计的基础上,对其中的一部分做了进一步的探讨与研究,并加以改进.首先,讨论广义岭估计的主要缺陷.
第一,只有在较小特征根所对应的特征向量的方向上估计才是不精确的,而在大的特征根所对应的特征向量的方向上估计是准确的.因此,我们只需要修正X′X全部对角元的一部分就可以,也就是只对X′X的接近于0的特征根进行修正.广义岭估计其实是对β进行了过分的压缩.
第二,广义岭估计的残差平方和为
RSS(K)=(Y-Xβ(K))′(Y-Xβ)
=(Y-Xβ)′(Y-Xβ)+(β(K)-β)′X′X(β(K)-β)
=RSSmin+ΔRSS.
这说明广义岭估计在降低均方误差的同时,又使得残差平方和增大.为了得到良好的拟合效果,我们当然要降低均方误差以使估计更接近真值,但又不能不顾及残差平方和的增大.
定义2[5]对于线性回顾模型,定义1-k型广义岭估计β1-k(K)=(X′X+ΦK0Φ′)-1X′Y.
其中,K0=11ki+1kp,k0,i=t,t+1,…,p.
设X′X的较大的特征根有t个,t为正整数,且0≤t≤p,则需要修正的小特征根有(p-t)个.在多重共线性的情况下,X′X的特征根发生两极分化的结果可以人为地确定该对哪些特征根进行修正.由定义可以看出,β1-k(K)是广义岭估计类β(K)的一种估计.当ki=0,i=1,2,…,p时,β1-k(K)即化为LS估计.对于线性回归方程典则形式(1),定义1-k型广义岭估计α1-k(K)=(Λ+K0)-1Z′Y式中,Z=XΦ,α=Φ′β,其中Φ=(φ1,φ2,…,φp),且φ1,φ2,…,φp为X′X的对应特征根λ1≥λ2≥…≥λp0的标准化特征向量.所以Z′Z=Λ=diag(λ1,λ2,…,λp).K0定义同上.
二、对β1-k(K)与β(K)的均方误差(MSE)进行比较分析
因为β1-k(K)是β(K)的一种特殊情况,先来看β(K)的MSE.
MSE(β(K))=σ2∑pi=1λi(λi+ki)2+∑pi=1k2iα2i(λi+ki)2 .
其中,K=diag(k1,k2,…,kp)0,对ki(i=1,2,…,p)求偏导数,并令其偏导数为0,得MSE(β(K))ki=2α2ikiλi(λi+ki)3-2σ2λi(λi+ki)3=0.解出,当ki=σ2α2i(i=1,2,…,p)时,MSE(β(K))达到最小.
将上式中正定对角阵K用本文提出的K0替换,即得
MSE(β1-k(K0))=E‖β1-k(K0)-β‖2
=tr[Cov(β1-k(K0))+(Eβ1-k(K0))-β(E(β1-k(K0))-β)′]
=σ2tr((Λ+K0)-1Λ(Λ+K0)-1Φ′Φ)+tr[Φ((Λ+K0)-1Λ-I)αα′((Λ+K0)-1Λ-I)Φ′]
=σ2∑ti=1λi(λi+1)2+σ2∑pi=t+1λi(λi+ki)2+∑pi=t+1k2iα2i(λi+ki)2 .
同理,当ki=σ2α2i(i=t+1,t+2,…,p)时,MSE(β1-k(K0))达到最小.此时,将ki=σ2α2i(i=1,2,…,t)代入,得
MSE(β(K))-MSE(β1-k(K0))
=σ2∑ti=1λi(λi+ki)2
您可能关注的文档
最近下载
- 专题07 作文(2023-2025年期中典型试题)(解析版)(2023-2025年期中典型试题,上海专用)八年级语文上册新教材.docx VIP
- 2025年MK 袋鼠数学竞赛Level-B (3-4年级) 真题+解析.pdf
- 初中语文诗词易错字34篇.pdf VIP
- 电子商务物流第二版毕娅习题答案.doc VIP
- 学堂在线 大国航母与舰载机(2025秋) 作业答案.docx VIP
- 《生涯发展报告》.pdf.pptx VIP
- LTCC多层电路基板设计规范-2016简版-1.pdf VIP
- 四年级语文上册第八单元作业设计.pdf VIP
- 学堂课程在线人工智能原理(北大)章节测试答案.docx
- 学前教育学专业职业生涯规划书发展报告应届硕士毕业生全国大学生职业规划大赛模板范文1500字.pdf VIP
原创力文档


文档评论(0)