- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2017整理5第五讲相关分析
第五章 相关系数 第一节 相关概述 第二节 积差相关系数 第三节 其他相关系数 第一节 相关概述 一、相关的含义 客观现象之间的数量联系存在着函数关系和相关关系。当一个或几个变量取定值时,另一个变量有确定的值与之对应,称为函数关系,可用Y=f(X)表示。 所谓相关就是指事物或随机现象之间的相互关系。事物之间在数量上的变化关系有的是属于因果关系(一种现象是另一种现象的原因,另一种现象是这种现象的结果),有的却不能直接作出因果关系的解释。当一个或几个相互联系的变量取一定数值时,与之相对应的另一个变量的值虽然不确定,但它仍然按某种规律在一定范围内变化,变量间的这种关系,被称为相关关系,如图5-0(b)。 二、相关的种类 (一)从变化方向上划分 1、正相关。两个变量中,一个变量增大,另一个变量对应值也随之增大;或一个变量值减小,另一个变量对应值也随之减小,两列变量变化方向相同。如学生的学习成绩与智商之间的关系;教师工作积极性与学校民主管理程度之间的相关,学校办学经费与教学设施之间的相关等。 2、负相关:两个变量中,一个变量增大,另一个变量对应值也随之减少;或一个变量值减小,另一个变量对应值也随之增大,两列变量变化方向相反。如学生学习能力水平与其解题时间的关系;运动员赛跑与所用时间之间的相关;学生学习能力与识记所用时间之间的相关等。 3、零相关。两变量值的变化方向无规律。如学生的身高与学生成绩的变化关系。 (二)从变量的个数上划分 1、简相关。两个变量之间的相关关系。如在一定年龄阶段,儿童身高与年龄的关系。本课所研究的都是简相关。 2、复相关。一个变量与两个或两个以上变量间的相关关系。如教师教学的成效与教师思维能力、教学方法、学生的学习准备情况之间的关系。 (三)从变量相互关系的程度上划分 1、高度相关。即两个变量相互联系非常密切。如大学生的学习成绩和智商的关系。当两个变量变化关系达到一一对应的密切程度时,数量变化就是确定性关系了,则称为完全相关。 2、低度相关。即两变量存在相互联系,但其关系并不密切。 三、相关散布图 它是表示两种事物之间的相关性及联系的模式。以直角坐标的横轴表示x列变量,纵轴表示y列变量,在相关的两变量对应值的垂直相交处画点,构成相关散布图。如图5-1。 相关散布图的用途: 1、判断相关是否直线式。 当两变量之间呈曲线趋势,其相关散布图呈弯月状,说明两变量之间是非线性关系,如图5-2(a)。 当两变量间呈线性趋势,其相关散布图是椭圆形,说明两变量之间是线性关系,称为直线相关,如图5-2(b)。 2、判断相关密切程度高低 相关散布图的形状和疏密,反映着相关程度的高低。如图5-3(a),散布图的椭圆形状较狭长,称为高度相关。 如果散布图的椭圆形状比较粗,称为低度相关。如图5-3(b)。 3、判断相关变化方向 正相关:散布点主要位于一、三象限。如图5-4(a),即一个变量增加(或减少),另一个变量也增加(或减少)。 负相关:若散布点主要位于二、四象限,如图5-4(b),即一个变量增加(或减少),另一个变量也减少(或增加)。 零相关:散布点的变化无一定规律。如图5-4(c)。 四、相关系数 通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数。总体相关系数用ρ(读“柔”)表示,样本相关系数用r表示。 相关系数r的取值范围是-1≤r ≤ 1,一般取小数点后两位。 r的正负号表明两变量间变化的方向;|r|表明两变量间相关的程度,r0表示正相关,r0表示负相关,r=0表示零相关。|r|越接近于1,表明两变量相关程度越高,它们之间的关系越密切。 附加说明: (1)两变量间存在相关,仅意味着变量间有关联,并不一定是因果关系。 (2)相关系数不是等距的测量单位。 r是一个比值,不是由相等单位度量而来,不能进行加、减、乘、除运算。如r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。 (3)相关系数受变量取值区间大小及观测值个数的影响较大。 变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两列变量,计算的结果可能相关,如学生的身高与学习成绩。本书所举例题,数据较少,仅为说明计算方法时较方便。 (4)相关系数在特定情况下使用才具有意义。 如高中生身高与体重的相关系数用在儿童身上就没有意义。 (5)通过实际观测值计
文档评论(0)