- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 相关分析 双变量关系的描述技术 第七章 相关分析 7.1 相关分析的概念和相关分析过程 7.2 两个变量间的相关分析 7.3 偏相关分析 7.4 距离分析 7.1 相关分析的基本概念与分析过程 相关关系与相关分析 事物间的相互关系可以分为两种类型:函数关系和统计关系(相关关系)。函数关系是一一对应的确定性关系;统计关系则是不稳定、不确定的,意味着一个变量虽然受另外一个(或一组)变量影响,却并不由这一个(或一组)变量完全确定。例如家庭教育消费支出与家庭收入之间的关系就是一种相关关系。 在复杂的教育系统中,事物与现象之间的联系大多表现为相关关系而不是函数关系。衡量事物(或变量)之间相关程度的强弱,并用适当的统计指标表示出来,这个过程就是相关分析。 7.1 相关分析的基本概念与分析过程 线性相关分析与相关系数 研究两个变量间线性关系的程度,称为线性相关分析。相关系数是描述这种线性关系程度和方向的统计量,用r表示。 如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1r1, 如果x,y变化的方向一致,则称为正相关,r0,如果x,y变化的方向相反,则称为负相关,r0;而r=0表示无线性相关,一般地, |r|0.95 存在显著性相关; |r|?0.8 高度相关; 0.5? |r|0.8 中度相关; 0.3? |r|0.5 低度相关; |r|0.3 关系极弱,认为不相关 相关系数的值,仅仅是一个比值。它不是由相等单位度量而来(即不等距),也不是百分比,因此,不能直接作加、减、乘、除运算。 相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系。 存在相关的两个变量,也不一定存在因果关系。 散点图 相关分析的原理 若 >0,则x与y之间为正相关; 若 <0,则x与y之间为负相关; 若 →0,则x与y之间无相关关系。 相关分析中的可能错误 相关系数r是对两个变量之间线性关系的简单度量,因此当r=0时,只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,比如,它们之间可能存在非线性关系,如图(e)就属于这种情况。 相关分析中的可能错误 r的计算涉及到变量的标准差和协方差,其数值大小易受极端值的影响,特别是与自变量x的变化范围有很大关系。这时会产生两种情况:—是多数观察值不相关时,个别极瑞值引起中度相关,如图8.4(a);二是大多数观察值存在线性相关,个别极端值使观察数据呈非线性相关.如图8.4(b)。 相关分析中的可能错误 在对两个时间数列的相关分析中,r所表现的相关程度同样本数据的时间范围有很大关系。比如.两个现象在某段时期内的相关关系为线性的.而整个发展过程可能是非线性的,如图(a);或者在某段时期内无线性关系,而整个发展过程可能存在线性关系,如图(b) 相关分析中的可能错误 根据样本数据计算的r带有—定的随机性,样本数据越少,随机性则越大。对于不相关的两个变量计算出的r不—定为0,有时甚至会很高。但较大的r值不一定就意味着两个变量之间确实存在着较高的相关;反之,较小的r也不一定就意味着变量之间无相关关系,这就是所谓的虚假相关。为避免出现分析上的错误,在实际应用r时,必须对r的显著性进行检验,r在统计上是否显著,才是它能否作为变量之间线性关系度量的依据。 7.2 两个变量间的相关分析 1 定距—定距尺度的相关:积差相关 当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关(Pearson Cor.)。 积差相关的使用条件 两个变量都是由测量获得的连续性数据; 两个变量的总体都是呈正态分布,或接近正态分布,至少是单峰的对称分布。 必须是成对数据,而且每对数据之间必须是相互独立。 两个变量之间呈线性关系。 要排除共变因素的影响。 样本容量要大于等于30,计算出的积差相关系数才具有有效意义。 斯皮尔曼二列等级相关 当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。 其相关系数的计算公式为 例如:10名高三学生学习潜在能力测验与自学能力测验成绩如下表所示,问两者相关情况如何? 肯德尔和谐系数(Kendall’s tau-b) 当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度的量,称为肯德尔和谐系数。它常用来表示几个评定者对同一组学生成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况 当同一位评定者对所有被评事物的评定无相同等级时,其肯德尔和谐系数的计算公式为: 有相同等级的情况 当同一位评
文档评论(0)