- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七讲 相关分析 ——双变量关系之描述 一、基本概念与原理 变量之间的关系:函数关系和统计关系 比如,家庭收入和支出、一个人所受教育程度与其收入、子女身高和父母身高等,… 一、基本概念与原理 相关分析:衡量事物之间或称变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。 相关系数:衡量变量之间相关程度的一个量值。 相关关系 正相关、负相关与零相关 强相关、中度相关与弱相关 线性相关与非线性相关 相关系数 相关系数r的数值范围是在一1到十1之间。 相关系数r的正负号表示变化方向。“+”号表示变化方向一致,即正相关;“-”号表示变化方向相反,即负相关。 r的绝对值表示变量之间的密切程度(即强度)。绝对值越接近1,表示两个变量之间关系越密切;越接近0,表示两个变量之间关系越不密切。 相关系数 相关系数的值,仅仅是一个比值。它不是由相等单位度量而来(即不等距),也不是百分比,因此,不能直接作加、减、乘、除运算。 相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系,即存在相关的两个变量,不一定存在因果关系。 散点图 基本原理(以积差相关为例) 若 >0,则x与y之间为正相关; 若 <0,则x与y之间为负相关; 若 →0,则x与y之间无相关关系。 二、相关分析方法 连续变量的相关分析 等级变量的相关分析 质量相关分析 品质相关分析 偏相关分析 距离相关分析 连续变量的相关分析 连续变量即数据变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。如“年龄”、“收入”、“成绩”等变量。 当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关。通常用Pearson相关系数来衡量。 连续变量的相关分析 Pearson相关系数的计算公式 积差相关的使用条件 两个变量都是由测量获得的连续性数据; 两个变量的总体都是呈正态分布,或接近正态分布,至少是单峰的对称分布。 必须是成对数据,而且每对数据之间必须是相互独立。 两个变量之间呈线性关系。 要排除共变因素的影响。 样本容量要大于等于30,计算出的积差相关系数才具有有效意义。 积差相关系数的显著性检验 ρ=0 统计假设 H0: ρ=0; H1: ρ≠0 统计量 T统计量服从n-2个自由度的t分布。 积差相关系数的显著性检验 ρ≠0 ρ≠0时r的样本分布不是正态,这时需要将r与ρ都转换成费舍 。 的分布可以认为是正态,其平均数 ,标准误 这样就可以进行Z检验了。 统计量 如表所示,10个学生初一数学分数与初二数学分数的相关系数为0.87,问从总体上来说,初一与初二数学分数是否存在相关? 检验的步骤 提出假设 计算检验统计量 统计决断 例如:29个学生几何期中与期末考试成绩的相关系数r=0.30,问全年级几何期中与期末考试成绩的相关系数是否为0.64? 提出假设 等距转换 选择检验统计量并计算其值 统计决断 即全年级几何期中与期末考试成绩之间的相关系数极少可能是0.64。 等级变量的相关分析 是指以等级次序排列或以等级次序表示的变量之间的相关。 当测量得到的数据不是等距或等比数据,而是具有等级顺序的数据;或者得到的数据是等距或等比数据,但其所来自的总体分布不是正态的,不满足求积差相关的要求。这时就要运用等级相关系数。 它主要包括斯皮尔曼(spearman)二列等级相关及肯德尔和谐系数多列等级相关. 斯皮尔曼二列等级相关 当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为Spearman等级相关。 例:10名高三学生学习潜在能力测验与自学能力测验成绩如下表所示,问两者相关情况如何? 等级相关系数的显著性检验 与积差相关系数检验的方法相同 10个学生学习潜在能力与自学能力测验成绩相关系数为0.891,问从总体上说,两者是否存在相关? 检验的步骤 提出假设 计算检验统计量的值 统计决断 所以学生的学习潜在能力与自学能力之间存在着较高的正相关。 肯德尔和谐系数(Kendall’s tau-b) 当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度的量,称为肯德尔和谐系数。它常用来表示几个评定者对同一组学生成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况 当同一位评定者对所有被评事物的评定无相同等级时,其肯德尔和谐系数的计算公式为: 有相同等级的情况 当同一
文档评论(0)