- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简介回归假设的正式描述体重的案例如何得到满意的回归
读者:梁中耀
时间:2016 年4 月17 日
书名:理解回归假设
作者:[美] William D. Berry
翻译:余珊珊
来源:《格致方法·定量研究系列》,吴晓刚主编
1. 简介
2. 回归假设的正式描述
2.1 回归分析概述
在本书中,我们假设回归统计量中包含那些理论中提到的、对因变量有因果影响的自变量,而读者应
该知道的是,在正式的多元回归假设中并不包含因果关系。任何对于回归系数“因果关系”的判断必须基
于回归分析以外的理论。
2.2 误差项的作用
在研究回归分析的文献中,一个真实的模型通常被构想为一种可以解释总体中所有关于因变量的原因
的模型,在具体的社会科学应用中,要搞清楚真实的模型是不可能的。
统计模型的条件真实性:Luskin(1991:1038)写道,可能真的会有一个给定的独特真实模型——在某种
给定的概念集合上,或者给定的因果距离上。也就是说,对于一个特定的因变量,在不同的因果距离上可
能会存在一个特定的真实模型,而在不同的因果距离上,可能存在多个合理的统计模型来解释因变量。与
其担心回归模型是否符合特定的真实模型,而真实的模型是不可知的,我们更应该评判模型是否符合我们
的理论,以及他们能否回答我们关注的问题。
真实模型:Y E E R ,其中 表示因变量的内在随机性
R
j 0 1 1j p pj j j
估计模型:Y E E
j 1 1j k kj j
p k
回归模型残差项: ( ) Z R 。我们可以把回归模型中的残差项解释为,所有影响因
j 0 i ij j
i 1
变量但是没有被包含在回归模型中变量的联合作用,加上代表因变量在内的随机成分,组成的一个随机变
量。估计模型中删除的变量有如下几种消除原因:(1) 作用微弱;(2) 多重共线性;(3) 缺乏数据;(4) 被忽
视,即理论模型中没有纳入该变量。
2.3 其它回归假设
A1 :所有自变量是数量化的或者二分的,同时因变量是数量化的、连续的以及无限的。而且所有的变
量测量都没有误差
A2 :所有自变量都有非零方差
A3 :不存在多重共线性
A4 :误差均值为0
A5 :每个自变量和误差项均不相关
A6 :误差同方差
A7 :误差项不自相关
A8 :误差项服从正态分布
高斯-马尔科夫假设(A1-A7) 的条件下OLS 的估计量具有无偏性和有效性。
3. 体重的案例
4. 如何得到满意的回归假设结果
当正态分布的误差项保持不变时,每个OLS 回归系数的估计量的抽样分布也是正态分布。满足高斯-
马尔科夫假设的OLS 回归模型的最佳线性无偏估计量(BLUE) ,不能保证它是所有估计量中最好——它只
是在线性无偏估计量中是最好的。当然也不是说,所有的无偏估计量都比有偏估计量要好;在判断估计量
的总体质量时,分析者需要同时考虑偏误和方差。进一步,当某个具体的回归假设被违背,但OLS 统计量
保持无偏性时,我们并不能下结论说,违背回归假设是不重要的。
5. 回归假设的实际意义
5.1 从横截面回归中得到动态解释
回归模型可以是横截面数据,也可以是时间序列数据。如果仅用横截面数据来说明政策A 比政策
B 好,那么对于政策研究者而言,意义就很小了;相反,如果对于同一辖区居民研究由政策A 转向政
策B 其结论就有很大的理论和现实意义。这并不是说横截面数据对于社会科学界而言毫无意义。表达
变量间横截面关系的回归方程必须精确地符合跨单位和跨时间不变性。一般情况下,并不能严格满足,
至少需要近似满足。研究者应该抵制根据横截面回归系数进行动态解释,除非他们相信因变量的决定
过程在时间和空间上都高度的相似。
5.2 假设:缺乏完全多重共线性
当变量之间存在完全多重共线性时,OLS 无法得到唯一的系数估计量。多重共线性一般只会出现在如
下三种情况:(1) 错误地将“已经建立”线性关系的因变量包括在内,例如年龄=C- 出生年份;
文档评论(0)