- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
天大matlab大作业逐步回归分析方法.
逐步回归分析方法
在实际中,影响Y的因素很多,这些因素可能存在多重共线性(相关性),这就对系数的估计带来不合理的解释,从而影响对Y的分析和预测。
“最优”的回归方程就是包含所有对Y有影响的变量, 而不包含对Y影响不显著的变量回归方程。
选择“最优”的回归方程有以下几种方法:
从所有可能的因子(变量)组合的回归方程中选择最优者;
(2)从包含全部变量的回归方程中逐次剔除不显著因子;
(3)从一个变量开始,把变量逐个引入方程;
(4)“有进有出”的逐步回归分析。
以第四种方法,即逐步回归分析法在筛选变量方面较为理想.
逐步回归分析法的思想:
从一个自变量开始,视自变量Y作用的显著程度,从大到小地依次逐个引入回归方程。
当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。
引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。
对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。
这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。
原理:
1、最优选择的标准
设n为观测样本数,
为所有自变量构成的集合, 为X的子集。
(1)均方误差s2最小
达到最小
(2)预测均方误差最小
达到最小
统计量最小准则
达到最小
(4)AIC或BIC准则
或 达到最小
(5)修正R2准则
达到最大
2、选择最优回归子集的方法
(1)选择最优子集的简便方法:
逐步筛选法(STEPWISE)
向前引入法或 前进法(FORWARD)
向后剔除法或后退法(BACKWARD)
(2)计算量最大的全子集法:
R2选择法(RSQUARE)
Cp选择法(CP)
修正R2选择法(ADJRSQ)。
(3)计算量适中的选择法:
最小R2增量法(MINR)
最大R2增量法(MAXR)
步骤
1、前进法:
事先给定挑选自变量进入方程的显著性水平,按自变量对因变量y的贡献由大到小依次挑选自变量进入方程,直到方程外没有显著的自变量可引入为止。
该方法的特点是:自变量一旦被选入,就永远保留在模型中。
(1)将全部m个自变量,分别与因变量y建立一元回归方程;
(2)分别计算这m个一元回归方程中回归系数的检验统计量F,记为:
取最大值
若
停止筛选;
若
选入,不妨设是,进入步骤(3);
分别将自变量组,,......,与因变量y建立二元回归方程,计算回归方程中x2,x3,…,xm的回归系数检验统计量F,记为:
取其最大值
,
若
则停止筛选,y与 x1之间的回归方程就是最优的回归方程;若
选进xk2 ,不妨设xk2是 x2,进入步骤(4)。
(4)对已经选入模型的变量,x1,x2,如同前面的方法做下去,直到所有未被选入模型的自变量的F值都小于相应的临界值为止,这时的回归方程就是最优回归方程。
前进法的一般步骤:
假设已进行了l步筛选,并选入自变量x1,x2,…xl,现进行第l+1步筛选:
分别将自变量组 ,,....,与y建立l+1元回归方程;回归方程中的回归系数检验统计量记为:
记
若
停止筛选 ,上一步得到的回归方程,即为最优的回归方程;
若
将选进模型,进行下一步筛选。
前进法的缺点:不能反映自变量选进模型后的变化情况 。
后退法:
事先给定从方程中剔除自变量的显著性水平,开始全部自变量都在模型中,然后按自变量对y的贡献由小到大依次剔除,直至方程中没有不显著的变量可剔除为止。
该方法的特点是:自变量一旦被剔除,就不再进入模型
(1)建立全部自变量x1,x2,…,xm对因变量y的回归方程,对方程中m个自变量的回归系数b1,b2,…,bm进行F检验,相应的F值记为:
取最小值
若
没有自变量可剔除,此时的回归方程就是最优的回归方程
若
剔除xk1,不妨设xk1是xm,进入步骤(2)。
建立x1,x2,…,xm-1与因变量y的回归方程 ,对方程中自变量的回归系数进行F检验,相应的F值记为:
取最小值
若
则无自变量可剔除,此时的回归方程即最优的回归方程;
若
将xk2从模型中剔除,不妨设xk2就是xm-1,进入步骤(3);
(3)重复前面的做法,直至回归方程中各变量回归系数的F值均大于临界值,即方程中没有变量可剔除为止,此时的回归方程就是最优的回归方程。
后退法的一般步骤:
假设已经进行了l步剔除,模型中的自变量为x1,x2,…,xm-l ,现进行第l+1步剔除:
建立x1,x2,…,xm-l 对y的回归方程,对方程中x1,x2,…,xm-l的回归系数进行F检验,相应的
您可能关注的文档
- 大连理工制冷及低温工程..doc
- 2013年新事业单位会计制度测试..doc
- 大连理工大学OOP大作业_开关盒布线问题_..docx
- 大连理工大学单片机综合设计基于ZLG7290BPCF8563的时钟系统设计.docx
- 2013年新小企业会计准则常用会计科目内容..doc
- 2013年新增词汇解析最终考研..doc
- 2013年新交通违法行为代码机动车..doc
- 2013年新型自吸过滤式防毒面具全面罩详解..doc
- 2013年新改革四六级翻译1..doc
- 2013年报考-广东轻工职业技术学院介绍..doc
- 天然气水合物开采技术设备数字化管理2025年预研报告.docx
- 2025年罕见病药物研发激励政策与产业可持续发展研究报告.docx
- 广东省汕尾市陆丰市东海新龙中学2025年中考模拟英语试题四(含答案).pdf
- 基于国家智慧教育云平台的高中英语阅读教学与学生评价研究教学研究课题报告.docx
- 教学查房急性胰腺炎.ppt
- 2025年银行零售业务数字化营销转型中的金融科技产品创新报告.docx
- 人工智能教育空间情境化学习场景在高中生物实验教学中的应用与效果评价教学研究课题报告.docx
- 6 《民间艺术在文化品牌建设中的传统与现代结合》教学研究课题报告.docx
- 信息技术在智能交通信号控制与智能交通优化中的应用教学研究课题报告.docx
- 高中政治课堂中的思辨能力培养策略研究教学研究课题报告.docx
文档评论(0)