第十二章相关与回归分析精品文档.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章相关与回归分析精品文档

第十二章 相关与回归分析 至第九章,我们讨论的都是单变量统计方法。但是,社会学研究不满足于对单变量的分析,往往要求进一步分析双变量之间的关系,然后再拓展到分析多变量之间的关系。第十章提出了两总体的检验及估计的问题,这意味着我们开始与双变量统计方法打交道了。双变量统计与单变量统计最大的不同之处是,客观事物间的关联性开始披露出来。在社会统计学中,研究客观事物之间相互关联的数量特征具有十分重要的理论意义和实践意义。所以,这一章我们将把相关关系的讨论深入下去,不仅要对相关关系的存在给出判断,更要对相关关系的强度给出测量,同时要披露两变量间的因果联系,其内容分为相关分析和回归分析这两个大的方面。 第一节 变量之间的相互关系 提到变量之间的关系,人们很容易想到变量间的确定性关系。确定性关系的特点是当一个变量值确定后,另一个变量值也就完全确定了。确定性关系往往可以表示成函数形式,如圆的半径和面积的关系,R=。与此不同,在变量间的非确定性关系中,给定了一个变量值,另一个变量值还可以在一定的范围内变化。如家庭的消费支出与家庭收入,同样收入的家庭,其支出却可能有很大的差异,因为除了受收入高低的影响外,家庭消费支出还受其他许多因素的影响。非确定性关系还有人的身高和体重之间的关系,犯罪与年龄之间的关系,吸烟量和寿命之间的关系,校园环境和学生体质之间的关系等等。通常这类非确定性关系被称为相关关系,它必须借助于统计手段才能加以研究,故又称为统计相关。 1.相关程度与方向 从一定意义上讲,函数关系是相关关系的一个特例,即变量间严格一一对应,这是相关程度最强的一种相关关系,称为完全相关(perfect association)。而变量相关程度的另一个极端值是无相关(no association)或零相关(zero association),即变量之间不存在任何数量上的依存关系。相关程度介于两个极端值之间的则是不完全相关,相关关系大多指的是这种情况,这时变量间在数量关系上有着不很严格的相互依存关系。 相关关系既可以表示为统计方程式,也可以用图形来表示。虽然大多数真实的相关关系的图形都是曲线,但由于数学手段上的局限性,统计学探讨的最多的则是定距—定距变量间能近似地表现为一条直线的线性相关。在统计中,对于线性相关,采用相关系数(记作r)这一指标来量度相关关系程度或强度。就线性相关来说,当=l时,表示为完全相关;当r=0时,表现为无相关或零相关;当01时,表现为不完全相关。但在采用相关系数r这一指标时必须注意到,存在着完善曲线而r=0的情况。当然,变量在其他测量层次的关系强度,也可以用同样的思路加以考虑。 当变量间相关时,还可以探讨其相关方向,可以分正和负两个方向。所谓正相关关系是指一个变量的值增加时,另一变量的值也增加。例如,受教育水平越高,则找到高薪水工作的机会也越大。而负相关关系是指一个变量的值增加时,另一变量的值却减少。例如,受教育水平越高,理想子女数目越少。要强调的是,只有定序以上测量层次的变量才能分析相关方向,因为只有这些变量的值有高低或多少之分。至于定类变量,由于变量的值并无大小、高低之分,故定类变量与其他变量相关时就没有正负方向了。 2.因果关系 除了相关程度与方向这两种性质外,还应注意两个变量的相关关系是否具有因果性,因为相关的两个变量,可能只是一种共同变化,不一定就是因果关系。只有当两个变量之间的关系同时满足以下三个条件时,才能断定这种关系是因果关系: (1)两个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化。 (2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的。 (3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。 例如,如果说“社会整合程度影响越轨行为”,那么,首先“社会整合(社会组织中一个人与大多数人相结合的程度)与“越轨行为”(偏离或违反社会规范的行为)之间是共变的,即它们共同发生变化。其次,假如控制其他可能与“越轨行为”相关的因素(如社会经济地位、年龄、性别等),“社会整合”与“越轨行为”也仍然是相关的。最后,在时间上“社会整合”的变化先于“越轨行为”的出现,由此可以认为这种关系是因果关系。 因果关系是一种非对称关系(asymmetrical relationship),这时只是自变量影响因变量,因变量不会反过来影响自变量。如果不能确定或无法区分变量的作用方向,这种情况就称为对称关系(symmetrical relationship)。例如,性别差异会引起晋升的快慢,反过来则不然;这里性别是自变量,晋升是因变量,二者形成非对称的关系。但是,对于人们之间交往程度与关系密切程度两个变量来说,就很难确定谁是自变量,谁是因变量,因为交往的多

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档