- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析
——方法、数据与R的应用
刘超
statchao@buaa.edu.cn
北京航空航天大学数学科学学院
2020年1月20 日
课件仅供教学使用
刘 超 ,回归分析——方法、
数据与R的应用,高等教育
出版社,2019年10月
第7章 模型选择
上课之前的话
需要为数据选择好的回归模型
并不是自变量越多越好,而是尽可能少而精。通常不
能在模型中包含所有可用的变量
• (1) 奥卡姆剃刀原则指出,在一个现象的几个合理的解释中, 最简单的是最
好的。应用于回归分析,这意味着充分拟合数据的最小模型是最好的
• (2) 不必要的自变量会增加估计噪声。在某些情况下,收集附加变量的数
据需要花费更多的时间和金钱,较小的预测模型可能更经济
• (3) 如果自变量在回归模型中全部都使用的话,就会出现多重共线性等问
题。不仅模型的解释可能会很困难, 而且预测性也会降低
当比较潜在模型时,可以使用一些基于标准或者检验
的方法做出选择
目的与要求
(1)理解模型选择的必要性
2
(2)掌握 、C 和AIC等常见的模型选择标准
p
(3)掌握逐步回归等基于假设检验的模型选择方法
(4)掌握不同的模型选择方法在R软件中的实现
7.1 基于标准的方法
7.1 基于标准的方法
几种模型选择标准
• 2
• C
p
• AIC
在回归模型的残差平方和(RSS)和模型复杂
度p之间的平衡(trade-off)
2
7.1.1 统计量
2 2
一个常用的选择标准是第三章介绍的调整后的R ,即 :
2 RSS / (n − p −1) (1 − R2 )(n −1)
R =1 − =1 −
a TSS / (n −1) n − −
p 1
其中n为样本量, p 为自变量个数, TSS、RSS分别表示总的平方
和与残差平方和
由于R2 =1 − RSS , 向模型添加变量会减少RSS, 因而会增加R2
TSS
2
• R 并不是一个好的标准, 它总会选择最大可能的模型
2
• 通过引进自变量数量p ,对自变量增加进行了约束
2
可以从拟合优度的角度在一系列回归模型中选择 最大的回
归模型作为最优模型
2
文档评论(0)