- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
理解回归假设
理解回归假设
一 引言
在任何回归分析被运用到社会科学研究的时候,研究者总会明确的提出无数的假设。社会科学的定量研究已经十分流行,以至于几乎所有的研究者都能自信地不费吹灰之力地说出一长串多元回归假设;但是他们很少能够深刻理解这些假设的实质含义。如果我们对这些假设的理解仅仅局限于死记硬背,就无法把这些假设运用到对具体问题的分析。
本文的目的是描述回归假设,并在某种程度上鼓励研究者从死记硬背中解脱出来,转而去理解如何让考察假设是否能够与一个具体的研究相适应。讨论仅限于回归方法,因为回归在社会科学方法论中占据主导地位。
本文以对标准多元回归假设的回顾作为开头,因为这些知识通常出现在计量经济学或者回归分析的课本中;然后考察每一个假设的实际意义,并强调研究者如何评估每一个假设是否符合实际研究的需要。
二 回归假设的正式描述
(一)回归分析概述 1
此式表示在给定自变量的条件下,应变量的期望值为。以两个自变量为例:
一般情况下,自变量的系数成为“偏斜系数”,指的是当自变量变化一个单位,因变量期望值随之变化的幅度。如果我们仅仅让回归统计量包含那些理论中提到的、对因变量有因果影响的自变量,则可以被解释为各个自变量对因变量的影响强度的测量值。但是,我们应该记住:在正式的多元回归假设中不包括因果关系。因此,任何对于回归系数的“因果关系”的判断都必须基于回归分析以外的理论。因此,一个好的研究应该能够给出实证研究所涉及的个变量的理论基础。
在解释的均值时,简单地说“当所有其他自变量都保持不变时”,而不明确的说哪些值保持不变,是说得通的。因为在式(1)每增加一个单位,的期望值随之变化同样的幅度,不论其他的取值是否恒定,也不论取值所处的位置。简单的说,每个自变量对应变量的影响不会因为其他自变量的变化而变化,也不会应为自己的变化而变化。也即没有交互作用(我们可以把自变量的平方项看作自己与自己的交互项)。
(二)误差项的作用
在回归模型中,尽管因变量的条件均值被假定完全落在期望平面上,但是其真实值被认为是由所能观测到的自变量和由于某种原因无法得到的其他因素共同决定的。也即由期望值(一般认为自变量决定期望值)和误差项决定的。 (2)
还可以写为:。要理解回归假设的实质意义,理解误差项至关重要!
为了理解误差项的含义,我们首先要弄清真实模型的含义。在研究回归分析的文献中,一个真实模型通常被认为是一种可以解释总体中所有关于因变量的原因的模型。但是,具体到社会科学应用研究中,要想搞清真实模型实属不易。但是,我们假设这样模型的存在或许是合理的,尽管对于研究者而言,这是一个不可知的模型。一个给定的应变量总是可以用很多等价且有效的方式进行解释——依靠大量的、理论得出的、异常细致的自变量或者基于少量的理论而略显粗糙的自变量,以及那些能够比较直接地反应其影响的变量,或者那些不直接的发挥其作用的变量(Luskin,1991)。
事实上,对于每个能想到的社会科学因变量,真实模型是否存在值得怀疑,即使真的存在,能否搞清也值得怀疑。因此,在研究之前思考这些真实模型是没有帮助的。毕竟,好的研究是由关键问题引导的,那是由理论和假设所激起的。与其担心回归模型是否符合“真实模型”,不如评判我们所设定的模型是否符合我们的理论,以及他们能否回答所要解决的问题。不过为了弄清误差项的意义,假设真实模型的存在是有意义的。
所以,假设总体中有一种真实模型能够解释因变量的所有变化,毫无疑问,这将会是一个超长的模型: (3)
其中,表示有限但非常大的解释变量的集合。
即使真实模型不是完全决定的,因为有一些“内在的”变量会约束人们的行为,以至于不能被其他变量完全解释,但是,绝大多数关于回归分析的教材仍然采用这种观点。这些内在的随机性有时是因为人类行为的“自由意愿”或者完全是由“不可预知的事件”造成的。一个悖论是:当所谓的人类行为的“内在随机性”作为因变量的一部分时,我们会对它更加准确的描述。从这种观点看,把随机成分引入真实模型意味着这个模型将不是真实模型。 (4)
在实际研究中,永远不可能在经验分析中对真实模型进行研究。我们总可以排除式(4)中的一些(实际上是绝大部分)变量,进而得到一个有几个自变量和误差项构成的估计模型: (5)
因此,我们把误差项解释为,所有影响因变量的但却没有被包括在回归因子中的变量的联合作用,同时加上一些用任何在因变量中体现的内生的随机成分来表示的“随机的变量”。
尽管很容易观察到,在任何具体的回归研究中,研究者总会排除一些实际上影响因变量的因素,但是了解清楚排除这些因素的具体原因是必要的。首先,这些被排除的因素对因变量的影响是微弱的。如果有微弱作用的自变量和方程中其他自变量有强烈影响的变量之间有高度相关性,那么包括这些作用“微弱的”变量将会提高这些作用“强烈的”变量的偏斜系数的
您可能关注的文档
最近下载
- 乡村振兴视角下农村中小学教师胜任力的现状剖析与提升路径探究.docx VIP
- GB∕T 13861-2022《生产过程危险和有害因素》应用之3:危险源(环境因素)识别清单【(危险和有害因素类别、伤害方式、致害物、起因物、风险情景描述、事故类别、后果与影响)】.docx VIP
- 美学 全册教案.pdf VIP
- 恒达富士WTVF-VF1电气原理图.pdf VIP
- 《九制黄精加工技术规程》(DB43T 2980-2024).pdf VIP
- 骨伤科临床常用中药外治经验方二首.pdf VIP
- GB∕T 13861-2022《生产过程危险和有害因素》应用之2:危险源(物的因素)识别清单【(危险和有害因素类别、伤害方式、致害物、起因物、风险情景描述、事故类别、后果与影响)】.pdf VIP
- 国家职业标准--计量员.docx VIP
- Wistron FMD SOP to Vendor_May2018全物质揭露操作说明.pdf VIP
- 箱体尺寸自动计算表.xls VIP
文档评论(0)